AI 기술은 노력의 판매에서 검증된 결과의 판매로 전환되고 있다

원문은 twarx.com에서 처음 게시되었습니다 - 전체 인터랙티브 버전은 그곳에서 읽을 수 있습니다.

최종 업데이트: 2026년 6월 22일

**AI 기술 (AI technology)**로 승리하고 있는 기업들은 가장 많은 GPU를 보유한 기업이 아닙니다. 그들은 조정 (coordination) 문제를 해결한 기업들입니다. 그리고 자신이 사랑했던 Google 소프트웨어 엔지니어 직무를 막 떠난 23세의 여성은 바로 그 격차에 자신의 커리지를 걸고 있습니다. 이는 AI 기술의 다음 단계가 가공되지 않은 출력 (raw output)이 아니라 검증된 결과 (verified outcomes)에 관한 것이라는 가장 명확한 신호입니다.

2026년 6월 22일, Business Insider는 뉴욕에 기반을 둔 전직 Google 엔지니어인 Aashna Doshi의 인터뷰 에세이를 게재했습니다. 그녀는 2026년 5월에 퇴사하여 Bounty를 구축하기 시작했습니다. Bounty는 기업들이 후보자 소싱이나 리드 생성과 같은 작업을 게시하고 검증된 결과에 대해서만 비용을 지불하는 결과 기반 (outcome-based) AI 마켓플레이스입니다. 이 단 하나의 설계 선택은 오늘날 AI 기술에서 가장 깊고 해결되지 않은 문제를 드러냅니다.

이 글을 끝까지 읽으시면, 결과 기반 AI의 시스템 아키텍처 (systems architecture), 왜 대부분의 에이전트 워크플로우 (agent workflows)가 조용히 실패하는지, 그리고 실제로 결과물을 만들어내는 조정 계층 (coordination layers)을 어떻게 구축하는지에 대해 이해하게 될 것입니다.

Aashna Doshi, 23, former Google software engineer who left to build AI startup Bounty

Aashna Doshi(23세)는 Google에 재직 중일 때 '0 to 1' 팟캐스트를 시작했으며, 2026년 5월에 결과 기반 AI 마켓플레이스인 Bounty를 구축하기 위해 퇴사했습니다. 출처: Business Insider

개요: 무엇이 발표되었으며 이것이 왜 변화의 신호인가

대부분의 AI 워크플로우(workflows)는 완전히 잘못된 문제를 해결하고 있습니다. 구매자는 오직 _검증된 결과(verified outcomes)_에만 관심을 두는 반면, 현재의 워크플로우는 생성된 토큰(tokens), 가동된 에이전트(agents), 오케스트레이션된 파이프라인(pipelines)과 같은 출력(output)을 최적화하는 데 급급합니다. Doshi의 새로운 회사인 Bounty는 업계가 AI _노력(effort)_을 판매하는 것에서 AI _결과(results)_를 판매하는 것으로 이동하고 있음을 보여주는 가장 명확한 시장 신호입니다.

Business Insider 소스에서 확인된 사실은 다음과 같습니다:

누가 (Who): 뉴욕에 기반을 둔 전직 Google 소프트웨어 엔지니어인 Aashna Doshi(23세)와 그녀의 팟캐스트 공동 진행자인 빅테크(Big Tech) 소속 소프트웨어 엔지니어.
무엇을 (What): Bounty — '기업이 후보자 소싱, 아웃리치(outreach) 실행, 리드(leads) 생성과 같은 특정 작업을 게시하고, 검증된 결과에 대해서만 비용을 지불하는 결과 기반(outcome-based) AI 마켓플레이스'로 설명됨.
언제 (When): Doshi는 2026년 5월에 Google을 떠났으며, 이 에세이는 2026년 6월 22일에 게시되었습니다.
배경 (Backstory): 그녀는 Georgia Tech을 졸업하기 몇 달 전인 2024년 2월경 캘리포니아 기반 직무에 대해 Google로부터 풀타임 오퍼(offer)를 받았으나 이를 거절했으며, 두 달 후 뉴욕 Google 직무를 수락했습니다.
팟캐스트 (The podcast): '0 to 1' 팟캐스트는 2025년 초에 시작되어 첫해 안에 YouTube 조회수 100,000회를 돌파했으며, 결과적으로 Amazon과 Microsoft 출신의 게스트들을 섭외했습니다.

표면적으로는 커리어에 관한 이야기입니다. 하지만 시니어 엔지니어와 AI 리드들에게 본질은 아키텍처(Architecture)에 있습니다. '기업이 검증된 결과에 대해서만 비용을 지불하는 결과 기반 마켓플레이스(outcome-based marketplace)'는 단순한 UX(사용자 경험) 결정이 아닙니다. 이는 코디네이션 레이어(coordination-layer, 조정 계층)의 결정입니다. 여기에는 작업 분해(task decomposition), 멀티 에이전트 실행(multi-agent execution), 결과 검증(result verification), 그리고 요청된 사항과 전달된 사항 사이의 간극을 메우는 신뢰 메커니즘(trust mechanism)이 필요합니다. 의도(intent)와 검증된 결과(verified outcome) 사이의 그 간극이야말로 현대 AI 기술에서 엔지니어링하기 가장 어려운 단 한 가지 요소입니다. 저는 팀들이 이를 해결하기 위해 분기 전체를 소비하고도 여전히 자신의 명성을 걸 수 있을 만한 결과물을 내놓지 못하는 것을 목격해 왔습니다.

새롭게 명명된 프레임워크

AI 코디네이션 갭 (The AI Coordination Gap)

AI 코디네이션 갭(AI Coordination Gap)은 에이전트가 출력을 생성하는 것과 그 출력이 검증 가능하게 정확하고, 완전하며, 원래의 의도와 일치하는 것 사이의 체계적인 거리입니다. 대부분의 에이전트형 AI 워크플로우(agentic AI workflows)가 조용히 실패하는 지점이 바로 여기입니다. 이는 모델이 약해서가 아니라, 결과를 보장하는 레이어가 없기 때문입니다.

Doshi는 이 간극이 왜 지금 중요한지에 대해 두 가지 이유를 들었는데, 이는 직접적으로 연결됩니다. 첫째, '빅테크(Big Tech) 기업에서 당신은 매우 거대한 기계의 한 부품일 뿐이며, 나는 스스로 결정을 내리고, 빠르게 움직이며, 내 작업의 직접적인 결과를 보고 싶었다'는 것입니다. 둘째, '현재 빌더(builders)들이 사용할 수 있는 AI 도구들은 이전의 그 어떤 것과도 다르다'는 점입니다. 이를 시스템 언어로 번역하자면, 오케스트레이션 도구(orchestration tooling; LangGraph, AutoGen, CrewAI, MCP)가 마침내 충분히 성숙하여 2인 규모의 팀이 코디네이션 갭을 상업적으로 메우려는 시도를 할 수 있게 되었다는 뜻입니다. 이것이 바로 여기서 다루는 실제 뉴스입니다. 이러한 변화에 대한 더 자세한 맥락은 우리의 AI 에이전트 현황(state of AI agents) 개요를 참조하십시오.

토큰(token) 단위로 AI를 판매하는 것은 노력을 판매하는 것입니다. 검증된 결과 단위로 AI를 판매하는 것은 신뢰를 판매하는 것입니다. 산업의 다음 단계 전체가 바로 그 차이점에 달려 있습니다.

이것은 무엇인가: 바운티(Bounty) 및 결과 기반 AI에 대한 쉬운 설명

당신이 12명 규모의 채용 대행사를 운영한다고 상상해 보십시오. 이번 주에 40명의 자격을 갖춘 소프트웨어 엔지니어링 후보자를 찾아야 합니다. 오늘날이라면 계약직을 고용하거나, SaaS 계정을 구매하거나, 혹은 직접 AI 에이전트(AI agents)를 연결한 뒤 그들이 가짜 LinkedIn 프로필을 만들어내는 환각(hallucination) 현상을 일으키지 않기를 기도해야 할 것입니다. 하지만 Bounty와 같은 **결과 기반 AI 마켓플레이스 (outcome-based AI marketplace)**를 이용하면, 대신 과업을 게시하기만 하면 됩니다. 예를 들어 '뉴욕 내 검증된 시니어 백엔드 후보자 40명 발굴'이라고 게시하고, 결과가 실제이며 조건에 부합하는 것으로 검증되었을 때만 비용을 지불합니다. 여기서 검증(verification)이 곧 제품입니다.

이는 오늘날 AI가 판매되는 방식의 근본적인 역전입니다. OpenAI, Anthropic, 그리고 거의 모든 래퍼 스타트업(wrapper startup)이 사용하는 지배적인 모델은 **소비 기반 (consumption-based)**입니다. 즉, 출력물이 유용했는지 여부와 관계없이 토큰(token)당, 계정(seat)당, 또는 API 호출(API call)당 비용을 지불합니다. 결과 기반 AI는 그 위험을 제공자에게 전가합니다. 제공자가 실패한 시도에 대한 비용을 감수하며, 사용자는 승리(성공)에 대해서만 비용을 지불합니다.

소비 기반 AI 제품은 30%의 확률로 틀렸을 때도 비용을 받습니다. 반면 결과 기반 제품은 그 30%에 대해 0원을 받습니다. 이 단 하나의 경제적 제약은 개발자가 대부분의 AI 스타트업이 건너뛰는 바로 그 지점인 '검증(verification)'을 실제로 해결하도록 강제합니다.

소상공인에게 그 매력은 명확합니다. 선불 구독도 없고, 도구를 배울 필요도 없으며, 프롬프트 엔지니어링 (prompt engineering)도 필요 없습니다. 그저 '완료'된 상태가 어떤 모습인지 설명하고, 완료된 결과에 대해 지불하면 됩니다. 개발자에게는 가혹합니다. 누수되는 파이프라인(leaky pipeline)을 출시할 수 없는데, 모든 누수가 자신의 마진(margin)에서 빠져나가기 때문입니다. 이러한 경제적 압박이 바로 AI 조정 격차(AI Coordination Gap)를 메우는 핵심입니다. 저희는 AI 가격 모델 (AI pricing models) 분석에서 관련 구매자 역학에 대해 다룹니다.

100,000+
'0 to 1' 팟캐스트가 출시 첫해에 돌파한 YouTube 조회수 — Bounty의 배포 엔진
[Business Insider, 2026](https://www.businessinsider.com/google-software-engineer-podcaster-quit-ai-tech-startup-job-market-2026-6)
...

Diagram comparing consumption-based AI pricing versus outcome-based AI marketplace pricing model

결과 기반 (Outcome-based) AI의 핵심에 있는 경제적 역전 현상: 소비 모델 (Consumption models)에서는 구매자가 실패 위험을 부담하지만, Bounty 모델에서는 구축자 (Builder)가 이를 부담합니다. 이는 실제 검증을 강제하며 AI 조정 격차 (AI Coordination Gap)를 해소합니다.

작동 원리: 결과 기반 AI의 배후 아키텍처 (Architecture)

결과 기반 마켓플레이스는 단일 모델 호출이 아닙니다. 이는 최소 다섯 개의 뚜렷한 계층으로 구성된 조정 시스템 (Coordination system)입니다. 게시된 Bounty로부터 검증된 지급까지 작업이 어떻게 흐르는지 설명합니다.

결과 기반 AI 작업 흐름: 게시된 Bounty에서 검증된 지급까지

  1

    **작업 명세 (Task Specification, 의도 포착)**

구매자가 '검증된 뉴욕시(NYC) 백엔드 후보자 40명 확보'와 같은 작업을 게시합니다. 시스템은 이를 성공 기준이 포함된 기계 판독 가능한 명세 (Spec)로 파싱합니다. 이것이 계약입니다. 만약 명세가 모호하다면 격차는 더욱 커집니다. 저는 명세가 제대로 정의되지 않은 작업이 5단계 전체를 거치며 아무도 인보이스(Invoice)가 나올 때까지 알아채지 못한 채 조용히 쓰레기 결과물 (Garbage)을 만들어내는 것을 보았습니다. 지연 시간 (Latency): 수 초.

↓

  2
...

오케스트레이션 계층 (Orchestration layer)이 목표를 하위 작업(Sub-tasks)으로 분해합니다: 검색, 보강 (Enrich), 중복 제거 (Dedupe), 검증 (Validate). LangGraph와 같은 그래프 프레임워크가 전문 에이전트 (Specialist agents) 간의 상태 (State)와 라우팅 (Routing)을 관리합니다. 지연 시간: 노드당 1초 미만의 라우팅.

↓

  3
...

전문 에이전트가 MCP를 통해 외부 도구를 호출하고, 벡터 데이터베이스 (Vector databases, RAG)에서 컨텍스트를 검색하며, 후보 결과물을 생성합니다. 이곳이 대부분의 토큰 소비가 발생하는 지점이며, 결과가 실패할 경우 구축자가 비용을 흡수하는 지점입니다.

↓

  4
...

각 결과물은 명세와 대조하여 확인됩니다: 후보자가 존재하는가, 역할에 부합하는가, 뉴욕시에 거주하는가? 검증 (Verification)은 두 번째 모델, 결정론적 규칙 (Deterministic rules), 또는 인간 참여형 (Human-in-the-loop) 방식이 될 수 있습니다. 이 계층이 전체 해자 (Moat)입니다. 검증이 없으면 지급도 없습니다.

↓

  5
...

오직 검증된 결과만이 결제를 유도합니다. 구매자는 40명의 확인된 후보자를 받고, 빌더(Builder)는 검증된 단위당 비용을 지급받습니다. 실패한 시도는 구매자가 아닌 빌더의 비용 부담입니다. 이것이 품질에 대한 경제적 강제 (Economic enforcement)입니다.

이 순서가 중요한 이유는 검증 계층 (Verification layer, 4단계)이 모든 소비 기반 (Consumption-based) AI 제품이 누락하고 있는 부분이며, '그럴듯한 출력 (Plausible output)'을 '지불 가능한 결과 (Paid outcome)'로 바꾸는 유일한 단계이기 때문입니다.

어려운 엔지니어링은 1~3단계가 아닙니다. LangGraph, Microsoft AutoGen, CrewAI와 같은 오케스트레이션 프레임워크 (Orchestration frameworks)는 현재 단계에서 분해 (Decomposition)와 실행 (Execution)을 상당히 잘 처리합니다. 팀들이 고전하는 지점은 바로 4단계입니다. 결과가 실제인지, 완전한지, 그리고 의도와 일치하는지를 검증하는 것은 아직 해결되지 않은 도메인 특화적 (Domain-specific) 문제입니다. 채용의 경우, 이는 후보자가 실제로 존재하는지 확인하는 것을 의미합니다. 리드 생성 (Lead-gen)의 경우, 해당 회사가 실존하며 연락이 가능한지를 의미합니다. 범용적인 검증기 (Generic verifier)는 존재하지 않습니다. 그렇지 않다고 말하는 사람은 무엇인가를 팔고 있는 것입니다.

누구나 답을 내놓는 에이전트 (Agent)를 만들 수 있습니다. 수조 달러 가치의 핵심 질문은, 그 답이 맞다는 것을 증명하는 계층을 누가 만드느냐 하는 것입니다. 그 계층이 바로 제품이며, 그 외의 모든 것은 배관 (Plumbing)에 불과합니다.

AI 조정 격차 (AI Coordination Gap)의 4가지 계층

조정 격차 (Coordination gap) 자체 내에서, 저는 실패 지점을 네 가지 명명된 계층으로 분류합니다. 각 계층은 의도 (Intent)와 검증된 결과 (Verified outcome)가 서로 어긋나는 별개의 지점입니다.

의도 드리프트 (Intent Drift) — 구매자가 작성한 사양(spec)과 시스템이 파싱(parse)한 사양이 일치하지 않는 현상입니다. 구조화된 의도 캡처(structured intent capture)와 명확화 루프(clarifying loops)를 통해 해결합니다.
분해 드리프트 (Decomposition Drift) — 오케스트레이터(orchestrator)가 작업을 분할하는 과정에서 원래 목표의 일부를 상실하는 현상입니다. 목표 고정형 계획(goal-anchored planning, 항상 최상위 목표를 유지하는 LangGraph 상태)을 통해 해결합니다.
실행 드리프트 (Execution Drift) — 에이전트(agent)가 환각(hallucinate)을 일으키거나, 잘못된 도구를 호출하거나, 데이터를 조작하는 현상입니다. 그라운딩 (RAG), 도구 호출 검증(tool-call validation), 그리고 MCP가 강제하는 인터페이스(MCP-enforced interfaces)를 통해 해결합니다.
검증 드리프트 (Verification Drift) — 검증기(verifier) 자체가 틀려 잘못된 결과를 수락하거나 올바른 결과를 거부하는 현상입니다. 결정론적 체크(deterministic checks)와 인간의 무작위 감사(human spot-audits)를 통해 해결합니다. 이 문제는 감사를 수행하기 전까지는 보이지 않기 때문에 가장 뼈아픈 문제가 됩니다.

새롭게 명명된 프레임워크

AI 조정 격차 (계층적 관점)

이 격차는 단일한 실패가 아니라 의도(Intent), 분해(Decomposition), 실행(Execution), 검증(Verification)이라는 네 가지가 쌓인 드리프트입니다. 실행(Execution) 단계만을 패치하는(더 나은 프롬프트, 더 큰 모델 사용) 제품은 나머지 세 가지의 구멍을 그대로 남겨두며, 이는 곱절로 증폭되어 문제를 일으킵니다.

[
▶

YouTube에서 시청하기
멀티 에이전트 오케스트레이션 및 검증 계층 설명
LangChain / AutoGen • 에이전트형 AI 아키텍처 (agentic AI architecture)

](https://www.youtube.com/results?search_query=multi+agent+orchestration+langgraph+verification)