CI, Guardrails & Review Boundaries

이 문서는 CCAF Domain 3를 이해하기 위한 개념 설명용 노트다.
여기서는 작업 루프 일반론보다, Claude Code의 결과가 어디서 신뢰 가능해지고 어디서 멈추고 어디서 인간 판단으로 넘어가야 하는가를 다룬다. 즉 CI, guardrails, review boundaries를 단순한 사후 검사 절차가 아니라, 작업 종료 조건과 신뢰 경계를 정하는 계층으로 이해하는 데 초점을 둔다.

왜 이 경계가 중요한가

Claude Code는 코드를 빠르게 읽고 수정할 수 있다.
하지만 빠르게 수정할 수 있다는 사실과,
그 변경이 곧바로 신뢰 가능하다는 사실은 다르다.

실제로 중요한 것은:

  • 어떤 변경은 자동 검증만으로 충분한지
  • 어떤 변경은 더 강한 가드레일이 필요한지
  • 어디서 인간 리뷰가 반드시 들어와야 하는지
  • 무엇을 작업 종료 조건으로 볼지

를 정하는 일이다.

즉 핵심은 단순히 “테스트를 돌린다”가 아니라,

모델 산출물이 어떤 신뢰 경계를 통과해야 하는가

다.


CI는 무엇을 해주는가

CI는 Claude Code의 결과를 자동으로 검증하는 기본 경로다.
보통 여기에는:

  • 테스트 실행
  • lint
  • typecheck
  • 빌드 검증
  • 형식 검사
  • 정책 검사

같은 것들이 들어간다.

중요한 점은 CI가 단순한 편의 기능이 아니라,

로컬에서 그럴듯해 보이는 수정과 실제로 merge 가능한 변경을 구분하는 필터

라는 점이다.

즉 로컬 성공은 시작일 수 있지만,
CI 통과는 훨씬 강한 신뢰 신호다.


guardrail은 무엇을 뜻하는가

guardrail은 모델이 잘못된 방향으로 너무 멀리 가기 전에 막거나 되돌리거나 확인하게 만드는 장치다.

예를 들면:

  • 위험한 파일 수정 금지
  • 특정 디렉토리 변경 시 추가 검증
  • 파괴적 명령 전 확인 (hooks로 구현 가능)
  • 테스트 실패 시 다음 단계 차단
  • 중요한 작업 전 인간 승인 요구 (escalation)

즉 guardrail은 단순 경고가 아니라,

작업 루프 안에 삽입된 제약과 차단 장치

에 가깝다.


review boundary는 왜 별도로 중요할까

자동 검증이 강해도,
모든 판단을 CI가 대신할 수는 없다.

예를 들어:

  • 제품 의도에 맞는가
  • 사용자 경험이 나아졌는가
  • 구조 변경이 팀 아키텍처 방향과 맞는가
  • 민감한 비즈니스 규칙을 제대로 해석했는가

이런 것은 여전히 인간 리뷰가 더 적합하다.

즉 review boundary는:

자동 검증이 충분한 지점과, 인간 판단이 필요한 지점을 구분하는 경계

다.

좋은 workflow는 이 경계를 흐리지 않는다.


로컬 성공과 mergeable state는 어떻게 다른가

이 구분은 실무적으로 중요하다.

로컬 성공

  • 수정이 끝나 보임
  • 간단한 확인은 통과
  • 작성자는 문제없어 보인다고 느낌

mergeable state

  • 필요한 자동 검증을 통과함
  • 팀 규약과 저장소 규칙에 맞음
  • 리뷰 가능한 diff를 가짐
  • 인간 검토가 필요한 경우 그 경계를 통과할 준비가 됨

즉 mergeable state는 단순히 코드가 돌아가는 상태가 아니라,

팀의 신뢰 경계를 통과할 준비가 된 상태

를 뜻한다.


작업 종료 조건은 왜 중요한가

Claude Code가 수정안을 만들었다고 해서 작업이 끝난 것은 아니다.
정말 중요한 질문은:

  • 테스트를 통과했는가
  • 필요한 검증을 마쳤는가
  • review boundary에 도달했는가
  • 사람이 봐야 할 작업이면 그 지점까지 정리됐는가

이다.

즉 좋은 운영에서 작업 종료 조건은
“모델이 답을 냈다”가 아니라,

신뢰 경계를 통과했거나, 다음 검토 경계까지 안전하게 도달했다

가 되어야 한다.


왜 이게 harness engineering과 맞닿는가

이 파트는 가장 직접적으로 harness engineering과 연결된다.

좋은 하니스는 모델이 결과를 내는 순간 작업을 끝내지 않는다.
그보다:

즉 CI, guardrails, review boundaries는

Claude Code 작업 루프의 종료 조건과 신뢰 경계를 설계하는 계층

이다.


흔한 오해

“테스트만 통과하면 충분하다”

아니다. 리뷰와 정책 검증이 더 필요한 경우가 많다.

“인간 리뷰는 자동화가 약할 때만 필요하다”

그렇지 않다. 성격상 자동화가 대신할 수 없는 판단도 있다.

“guardrail은 생산성을 떨어뜨리는 장애물이다”

오히려 큰 실수와 재작업을 줄여 전체 workflow를 더 안정적으로 만든다.


한 문장 요약

CI, guardrails, review boundaries는 Claude Code의 산출물이 자동 검증과 인간 판단을 어떤 신뢰 경계로 통과해야 하는지 정하는 종료 조건 설계다.