본문으로 건너뛰기

© 2026 Molayo

Zenn헤드라인2026. 06. 10. 10:07

약한 AI로 강한 AI와 싸우는 방법 — Semgrep의 검증 파이프라인에서 배우는 저자본 시대의 개인 개발 설계론

요약

강력한 모델의 비용 부담을 극복하기 위해 약한 모델을 효율적으로 활용하는 설계 전략을 제안합니다. Semgrep의 사례를 통해 판단 기준을 외부 규칙으로 고정하고 확신이 없는 경우 판단을 유보하는 설계 원칙을 설명합니다.

핵심 포인트

  • 모델 성능 차이가 에이전트 경제에서 경제적 손실로 직결됨
  • 판단 기준을 모델 내부가 아닌 외부 규칙(헌법)으로 고정해야 함
  • 확신할 수 없는 안건은 인간에게 넘기는 기권(Abstention) 전략 필요
  • 저자본 환경에서는 모델의 지능보다 설계의 정밀도 유지가 핵심

서론: AI가 「자본력의 차이」가 되기 시작하고 있다

Claude Mythos와 같은 프론티어 기반 모델(Frontier Foundation Model)은 눈부시게 고도화되고 있지만, 그에 비례하여 이용 비용도 계속해서 치솟고 있습니다. 최첨단 모델을 풍족하게 돌릴 수 있는 것은 자본력이 있는 조직뿐입니다. 「AI를 사용할 수 있느냐」가 아니라 「어느 수준의 AI를, 얼마나 사용할 수 있느냐」가 격차가 되는 시대가 바로 코앞까지 다가왔다고 느낍니다.

이러한 우려를 뒷받침하는 데이터가 있습니다. Anthropic이 2025년 12월에 사내에서 실시한 실험 「Project Deal」입니다. 69명의 직원에게 각각 AI 에이전트(AI Agent)를 할당하고, 실제 돈과 실제 상품을 사용하는 사내 마켓플레이스에서 협상부터 거래까지 모든 것을 AI에게 맡겼습니다.

주목해야 할 점은 동일한 참가자·동일한 상품·동일한 희망 조건으로 구성된 여러 격리 시장을 병행시키면서, 한쪽에서는 강력한 모델(Claude Opus 4.5)을, 다른 한쪽에서는 일부를 약한 모델(Claude Haiku 4.5)로 교체하여 비교했다는 점입니다. 결과는 명확했습니다.

  • 강력한 모델의 시장에서는,
    같은 사람이 같은 상품을 평균 $2.68 더 비싸게 팔고, $2.45 더 싸게 사고 있었다 - 극단적인 예로, 동일한 중고 접이식 자전거가 Opus 시장에서는 $65, Haiku 시장에서는 $38에 팔렸습니다.
  • 그리고 가장 중요한 것은,
    약한 모델을 사용하던 참가자는 자신이 손해를 보고 있다는 사실을 깨닫지 못했다

AI의 성능 차이가 그대로 경제적인 결과의 차이로 변환됩니다. 게다가 당사자에게는 보이지 않는 형태로 말이죠. 이것이 「에이전트 경제(Agent Economy)」의 현실입니다.

그렇다면 한정된 자원——예를 들어 로컬 LLM(Large Language Model)이나 저렴한 소형 모델——밖에 사용할 수 없는 개인 개발자는 이 구조 속에서 어떻게 싸워야 할까요?

본 기사에서는 그 답의 힌트를 의외의 장소에서 가져옵니다. 바로 정적 분석 도구 Semgrep의 AI 검증 파이프라인입니다.

Semgrep이 보여준 「정밀도를 고정한다」는 설계 사상

Semgrep은 SAST(정적 애플리케이션 보안 테스트) 도구이지만, 최근에는 AI(Semgrep Assistant)를 통한 탐지 결과의 자동 트리아지(Triage)로 잘 알려져 있습니다. 새로 탐지된 보안 소견 중 약 60%를 AI가 자동으로 오탐(False Positive) 판정하며, 인간이 감사했을 때의 동의율은 96%를 넘는다는 경이로운 수치를 기록하고 있습니다.

하지만 정말 흥미로운 것은 수치 그 자체가 아니라, 더 고성능인 모델이 등장했을 때의 동작입니다. Semgrep의 보고에 따르면, 새로운 강력한 모델로 교체하더라도 정밀도(동의율)는 급상승하지 않았습니다. 대신 어떤 일이 일어났느냐 하면, 동일한 95% 이상의 정밀도를 유지한 채, AI가 처리할 수 있는 안건의 「양」이 늘어난 것입니다.

이러한 동작은 우연이 아니라 설계입니다. 구조를 분해하면 세 가지 원칙에 도달합니다.

원칙 1: 판단 기준의 고정 (헌법)

「무엇을 근거로 오탐이라고 단정할 수 있는가」의 기준을 모델의 똑똑함이나 기분에 맡기지 않고, 외부 규칙으로서 고정합니다. Semgrep의 경우, 그것은 승인된 규칙 세트이며, 「Memories」라고 불리는 스코프가 지정된 조직 지식(예: 「이 내부 서비스를 통과한 데이터는 새니타이즈(Sanitize)된 것으로 간주한다」)입니다. 판단의 척도가 외부화되어 있기 때문에, 어떤 모델을 사용하더라도 판단의 질에 대한 정의는 변하지 않습니다.

원칙 2: 기권(Abstention)의 규율

AI는 모든 안건을 판단하려 하지 않습니다. 고정된 기준에 비추어 확신을 가지고 판단할 수 있는 안건만을 맡고, 그 외의 것은 모두 인간에게 넘깁니다. 이것이 정밀도 유지의 정체입니다.

이 설계에서는 모델의 성능 차이가 「정밀도의 차이」가 아니라 「맡을 수 있는 수비 범위의 차이」로 나타납니다.

  • 강력한 모델: 많은 안건에서 임계값을 넘는 확신을 가질 수 있음 → 자동 처리 60%
  • 약한 모델: 확신을 가질 수 있는 안건이 적음 → 자동 처리 30%(가정)

어느 경우든, 자동 처리된 부분의 품질은 동일합니다. 약한 모델은 「틀리는」 것이 아니라 「더 많이 기권하는」 것입니다. 부족한 부분을 채우는 것은 인간입니다.

원칙 3: 확신도 그 자체의 외부 감사 (교정, Calibration)

여기에 한 가지 간과하기 쉬운 전제가 있습니다. 「확신할 수 없는 것은 인간에게 넘긴다」가 기능하기 위해서는, AI가 자신의 확신도를 올바르게 자기 신고할 수 있어야 합니다. 이를 교정(Calibration)이라고 부르는데, 사실 약한 모델일수록 「알지 못하면서도 안다고 착각하는」 경향이 있어 교정 자체가 무너지기 쉽습니다.

그러므로 AI의 자기 보고(Self-reporting)를 신뢰해서는 안 됩니다. 인간이 정기적으로 자동 판단 샘플을 감사하고, 실측 동의율이 임계치(예: 95%) 미만으로 떨어지면 자동화 권한 범위를 기계적으로 축소한다. 확신도의 신뢰성 그 자체를 외부 루프(Outer loop)에서 계속해서 검증하는 것입니다.

개인 개발로의 번역: 「약한 AI × 고정 기준 × 인간」의 아키텍처

Semgrep의 이 설계는 보안 제품에 국한된 것이 아닙니다. 「한정된 지능 자원으로 출력 품질을 떨어뜨리지 않고 시스템을 운용하기 위한」 일반적인 아키텍처로 치환될 수 있습니다.

저자본 개인 개발로 번역하면 다음과 같습니다.

1. 일정 기준을 충족하는 부분만 현재 수중에 있는 「최대의 AI」로 자동화한다

먼저, 자신의 워크플로우(코딩, 리뷰, 문서 생성, 테스트, 조사……)를 공정으로 분해하고, 각 공정에 대해 「합격 정의」를 외부화합니다. 테스트를 통과할 것, 린터(Linter)를 통과할 것, 출력 스키마에 부합할 것, 인용된 행 번호가 실제로 존재할 것—기계적으로 검증할 수 있는 기준일수록 좋습니다.

그다음, 수중에 있는 로컬 LLM(Large Language Model)이나 저렴한 모델에게 공정을 실행하게 하고, 기준을 충족한 출력만을 채택합니다. 기준을 충족하지 못한 출력은 버리는 것이 아니라, 「기권」으로서 다음 단계로 넘깁니다.

포인트는 합격 기준이 모델 외부에 있기 때문에, 아무리 약한 모델을 사용하더라도 「채택된 결과물」의 품질은 일정하게 유지된다는 점입니다. 약한 모델을 사용함으로써 변하는 것은 품질이 아니라, 자동화할 수 있는 비율뿐입니다.

2. 기권된 부분은 인간이 담당하거나, 그 공정만 강한 AI로 이관한다

로컬 LLM이 확신을 갖지 못한 안건의 행선지는 두 가지입니다.

인간이 담당한다. 이는 패배가 아니라 설계상의 정상적인 루트입니다. Semgrep에서도 기권된 40%는 인간 보안 엔지니어가 처리합니다. 인간이라는 확실한 폴백(Fallback)이 있기 때문에 AI 측은 안심하고 기권할 수 있습니다.

그 공정만 강한 AI로 이관한다. 이것이 저자본 전략의 핵심입니다. 프런티어 모델(Frontier model)을 「상시 사용하는 베이스 모델」이 아니라, 기권 안건 전문 에스컬레이션(Escalation) 대상으로 사용하는 것입니다. 예를 들어:

  • 일상적인 코드 보완·정형 처리: 로컬 LLM (비용 거의 제로)
  • 로컬 LLM이 기준을 충족하지 못한 설계 판단·어려운 디버깅: 프런티어 모델에 단발성으로 투입 (종량제 과금)
  • 그럼에도 확신을 가질 수 없는 것: 인간이 판단

이렇게 하면 프런티어 모델에 대한 지불은 「전체 트래픽」이 아니라 「로컬 LLM의 기권율 × 안건 수」에 비례합니다. 총비용을 대폭 억제하면서 최종 결과물의 품질은 기준에 의해 고정됩니다. 이것이 「역할 분담을 통해 비용을 억제하면서 정밀도를 높이는」 구체적인 메커니즘입니다.

3. 교정 루프(Calibration loop)를 잊지 않는다

마지막으로 Project Deal의 가장 섬뜩한 발견을 떠올려 보십시오. 약한 AI를 사용하던 사람들은 손해를 보고 있다는 사실을 깨닫지 못했습니다.

개인 개발에서도 같은 일이 일어납니다. 로컬 LLM의 출력을 무비판적으로 계속 채택하다 보면, 품질 저하는 조용히, 인지하지 못하는 형태로 축적됩니다. 그렇기에:

  • 자동 채택된 결과물에서 정기적으로 샘플링하여 자신(또는 강한 AI)이 감사한다
  • 실측 합격률·후속 공정에서의 재작업(Rework)률을 기록한다
  • 수치가 악화되면 로컬 LLM의 자동화 범위를 축소하고 에스컬레이션 비율을 높인다

「AI가 자기 보고하는 자신감」이 아니라 「실측치」로 자동화 권한을 증감시킵니다. 이 외부 루프가 있어야 비로소 약한 모델을 안전하게 주력으로 사용할 수 있습니다.

결론: 저자본 개인 개발은 「기권하는 시스템」을 설계해야 한다

Project Deal이 보여준 것은 AI의 성능 차이가 경제적 격차로 직결되는 미래입니다. 하지만 Semgrep의 설계가 보여주는 것은, 성능 차이를 「품질의 차이」가 아니라 「자동화할 수 있는 범위의 차이」로 변환하는 아키텍처는 만들 수 있다는 사실입니다.

저자본 개인 개발이 취해야 할 방향성을 한 줄로 요약하면 다음과 같습니다.

똑똑한 AI를 사는 것이 아니라, 약한 AI가 정직하게 기권할 수 있는 시스템을 설계하라.

구체적으로는:

  • 각 공정의 합격 기준을 외부화·기계화한다 (헌법)
  • 수중에 있는 최대의 AI에게 기준을 충족할 수 있는 부분만 실행하게 한다 (기권의 규율)
  • 기권 안건은 인간이 맡거나, 그 공정만 프런티어 모델로 단발성 이관한다 (에스컬레이션)
  • 실측 합격률로 자동화 범위를 증감시킨다 (교정 루프)

이 구조에는 또 하나의 기쁜 성질이 있습니다. 향후 모델이 진화했을 때, 시스템을 다시 만들 필요가 없다는 점입니다. 기준(Criterion)과 루프(Loop)는 그대로 둔 채 새로운 모델을 끼워 넣기만 하면, 정밀도는 유지된 상태로 자동화율만 올라갑니다. Semgrep이 모델 업데이트 때마다 경험해 온 것과 동일한, 즉 "성능 향상이 처리량으로 전환되는" 현상을 개인의 워크플로우에서도 누릴 수 있습니다.

프런티어 모델(Frontier Model)과의 군비 경쟁에 자본으로 참여할 수 없다면, 참여하지 않아도 됩니다. **기준·기권·교정의 세트(Three-piece set)**를 갖춘 파이프라인이야말로 저자본 시대의 개인 개발자에게 가장 큰 자산이 될 것이다 — 이것이 이번 조사를 통해 얻은 결론입니다.

참고

Discussion

AI 자동 생성 콘텐츠

본 콘텐츠는 Zenn AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0