AI 에이전트를 위한 토큰 경제학: 왜 작업 자동화보다 워크플로우 소유권이 더 중요한가

AI 노동 경제학의 취약한 버전은 다음과 같습니다:

100,000달러의 연봉을 받는 지식 노동자가 2,730달러의 토큰 비용으로 대체될 수 있다는 것입니다.

이러한 프레임워크는 충격을 주기에는 효과적이지만, 운영 모델로서는 한계가 있습니다. 추론 (Inference) 비용이 저렴하다고 해서 생산 작업이 저렴해지는 것은 아닙니다. 여전히 컨텍스트 (Context), 도구 (Tools), 프롬프트 (Prompts), 권한 (Permissions), 재시도 (Retries), 평가 (Evaluation), 승인 (Approvals), 보안 (Security), 그리고 결과에 대해 책임을 질 누군가가 필요합니다.

더 나은 프레임워크는 다음과 같습니다:

이제 당신의 시간은 토큰 경제학 (Token economics)과 경쟁하지만, 실제 경쟁 단위는 사람이 아닙니다. 그것은 바로 반복 가능한 워크플로우 (Repeatable workflow)입니다.

왜 토큰 비용이 워크플로우 비용이 아닌가?

최근의 토큰 경제 모델에 따르면, 유사한 AI 워크플로우의 순수 토큰 비용은 연간 약 2,730달러로 추정되었습니다. 동일한 분석에서, 오케스트레이션 레이어 (Orchestration layer)를 포함한 완전한 AI 에이전트 (AI-agent) 워크플로우는 연간 82,000달러에 가깝습니다. 이는 100,000달러의 급여를 기준으로 한 완전한 인간 벤치마크인 연간 약 135,000달러보다는 여전히 의미 있게 낮지만, "AI 노동은 기본적으로 공짜다"라는 말과는 거리가 멉니다. [1]

이러한 구분은 중요합니다.

만약 인간의 역할을 오직 API 지출과만 비교한다면 잘못된 결정을 내리게 될 것입니다. 하지만 인간의 워크플로우를 완전한 AI 워크플로우와 비교한다면 실질적인 결정을 내리기 시작할 수 있습니다.

실제 비용에는 모델 호출 (Model calls), 검색 (Retrieval), 도구 접근 (Tool access), 프롬프트 및 워크플로우 설계 (Prompt and workflow design), 결정론적 체크 (Deterministic checks), 인간의 검토 (Human review), 실패한 시도 (Failed attempts), 모니터링 (Monitoring), 유지보수 (Maintenance), 그리고 거버넌스 (Governance)가 포함됩니다.

이 누락된 중간 단계가 바로 많은 AI 대체 서사들이 허술해지는 지점입니다.

왜 AI는 역할보다 워크플로우를 먼저 공격하는가?

더 유용한 질문은 "어떤 직업이 사라지는가?"가 아닙니다.

대신 이렇게 물어보십시오:

이 직무 내부의 어떤 반복 가능한 프로세스들이 이제 기계 보조 워크플로우 (Machine-assisted workflow)에 의해 수행될 수 있는가?

GPT 노출에 관한 2023년 OpenAI, OpenResearch, 그리고 University of Pennsylvania의 논문은 종종 잘못 인용되곤 합니다. 더 안전한 해석은 노동자의 약 80%가 업무 태스크의 최소 10%가 GPT에 의해 영향을 받을 수 있으며, 약 19%는 업무 태스크의 최소 50%가 영향을 받을 수 있다는 것입니다. [[2]]

이것은 업무의 80%가 이미 자동화되었다는 말과 동일하지 않습니다.

이는 태스크 노출 (Task exposure)이 광범위하고, 불균등하며, 워크플로우 특화적 (Workflow-specific)이라는 것을 의미합니다.

대부분의 역할은 판단, 커뮤니케이션, 소스 수집, 초안 작성, 검토, 라우팅 (Routing), 발행, 보고, 그리고 고객/팀 조율을 결합합니다. AI는 이러한 계층 중 일부를 흡수하는 데 있어 다른 부분보다 훨씬 더 뛰어납니다.

AI 자동화를 위한 실질적인 단위는 무엇인가?

운영자, 개발자, 마케터, 컨설턴트, 그리고 에이전시 팀에게 있어, 명확한 경계를 가진 워크플로우 (Workflow)가 올바른 단위입니다.

유용한 워크플로우는 입력 (Input), 승인된 소스 (Approved source), 변환 단계 (Transformation step), 품질 게이트 (Quality gate), 승인 지점 (Approval point), 출력 (Output), 그리고 측정 루프 (Measurement loop)라는 7가지 부분으로 구성됩니다.

업무가 그런 방식으로 기술되면, 어떤 부분이 에이전트 (Agent)에 속하는지, 어떤 부분이 결정론적 코드 (Deterministic code)가 필요한지, 그리고 어떤 부분이 인간에게 남아 있어야 하는지를 결정할 수 있습니다.

이 지점이 대부분의 “AI 에이전트” 프로젝트가 유용해지거나, 혹은 보여주기식 행위 (Theater)가 되는 분기점입니다.

만약 에이전트가 텍스트만 생성한다면, 그것은 초안 작성 보조 도구 (Drafting assistant)입니다. 하지만 에이전트가 적절한 소스를 읽고, 적절한 조치를 취하며, 검사를 수행하고, 증거를 보존하며, 품질이 충분하지 않을 때 멈출 수 있다면, 그것은 워크플로우 인프라 (Workflow infrastructure)가 되기 시작합니다.

개발자와 운영자에게 무엇이 변하는가?

새로운 문해력 (Literacy)은 단순히 프롬프팅 (Prompting)만이 아닙니다.

프롬프팅은 가시적인 계층입니다. 더 깊은 레버리지 (Leverage)는 워크플로우 소유권 (Workflow ownership)에서 나옵니다.

워크플로우 소유자는 어떤 증거가 허용되는지, “완료 (Done)”가 무엇을 의미하는지, 어떤 실패가 용납될 수 없는지, 어떤 검사가 결정론적인지, 언제 승인이 필요한지, 잘못된 출력 이후 시스템이 어떻게 복구되는지, 그리고 개선이 어떻게 측정되는지를 결정합니다.

그렇기 때문에 Claude Code, Codex, Cursor, Windsurf, n8n, MCP 서버, 그리고 리포지토리 레벨의 증명 루프(repo-level proof loops)와 같은 도구들이 중요합니다. 이들은 단순한 "파일과 함께 사용하는 AI 채팅"이 아닙니다. 이들은 지식 노동(knowledge work)을 위한 새로운 운영 계층(operating layer)의 초기 버전입니다.

엉망인 업무를 측정 가능한 워크플로우(workflows)로 전환할 수 있는 사람은 대체하기가 점점 더 어려워집니다.

반면, 반복적인 인지 작업(cognitive tasks)을 위해 시간만을 판매하는 사람은 토큰 경제학(token economics)에 의해 비교되기 쉬워집니다.

에이전트 워크플로우는 어떻게 매핑되어야 하는가?

시스템을 생각하는 실질적인 방법은 다음과 같습니다:

Table mapping five AI-agent workflow layers: source, draft or action, QA, distribution, and metrics, with what the human owns, what the agent can help with, and the required quality gate for each layer

모든 계층이 자동화되는 것은 아닙니다.

모든 계층이 명시적(explicit)이 되는 것입니다.

그 지점에서 비용, 품질, 그리고 속도가 함께 개선될 수 있습니다.

이것이 콘텐츠 및 마케팅 워크플로우에는 어떻게 적용되는가?

콘텐츠 제작을 예로 들어보겠습니다.

취약한 AI 버전은 다음과 같습니다: "AI 검색에 관한 기사를 써줘."

더 강력한 워크플로우 버전은 정전 페이지(canonical page)와 검색 의도(search intent)에서 시작하여, 내부 증거와 외부 소스를 수집하고, 작성 전 준비 상태를 점수화하며, 명확한 답변 구조로 초안을 작성하고, 주장과 각주를 확인하며, Medium, LinkedIn, DEV.to, Habr 또는 X에 맞춰 정전 기사를 변형하고, 가시적인 링크와 정전 참조(canonical references)를 검증하며, 해당 페이지가 크롤링, 인용, 공유 또는 재사용되는지를 측정합니다.

이것은 "AI가 콘텐츠를 쓰는 것"이 아닙니다.

이것은 인간 운영자가 편집권(editorial control)을 포기하지 않으면서 처리량(throughput)을 높이기 위해 AI를 사용하는, 통제된 콘텐츠 제작 회랑(content-production corridor)입니다.

이 차이는 SEO, AEO, GEO 및 AI 검색 가시성(visibility)에 있어 매우 중요합니다. 언어 모델(language model)은 단어를 빠르게 생성할 수 있습니다. 하지만 워크플로우는 신뢰할 수 있는 자산(assets)을 반복적으로 생성할 수 있습니다.

이것이 코딩 에이전트 워크플로우에는 어떻게 적용되는가?

취약한 코딩 에이전트 루프는 단순합니다: 수정을 요청하고, 패치(patch)를 수락하며, 문제가 해결되기를 바라는 것입니다.

더 강력한 루프는 실패하는 동작을 정의하고, 이를 재현하며, 실패를 확인하는 레드 체크 (red check)를 작성하거나 실행합니다. 그다음 가장 작고 안전한 변경을 수행하고, 증명 루프 (proof loop)를 실행하며, 실패 모드 (failure mode)를 문서화하고, 해당 버그 클래스 (bug class)를 다음 게이트 (gate)에 추가합니다.

이것이 바로 "에이전트 지속성 (agent persistence)"이 품질 저하를 일으키는 버그가 될 수 있는 이유입니다. 만약 에이전트가 더 나은 게이트 없이 계속해서 패치 (patching)만 반복한다면, 동일한 유형의 결함을 반복해서 발생시킬 수 있습니다. 더 높은 지속성이 해결책은 아닙니다. 더 명확한 워크플로우 경계 (workflow boundary)와 더 강력한 중단 조건 (stop condition)이 해결책입니다.

무엇을 먼저 구축해야 하는가?

실제 비즈니스 내에 AI 에이전트를 적용하려고 한다면, "역할을 대체한다"는 생각보다 더 작게 시작하십시오.

하나의 반복 가능한 워크플로우 (repeatable workflow)부터 시작하십시오.

무엇이 워크플로우를 시작하는지, 어떤 소스 (sources)가 허용되는지, 어떤 출력이 기대되는지, 에이전트가 할 수 있는 일과 해서는 안 되는 일은 무엇인지, 어떤 체크 (checks)를 통과해야 하는지, 어디에서 사람이 승인하거나 거절하는지, 그리고 전달 후 성공을 어떻게 측정하는지를 기록하십시오.

그런 다음, 지루한 중간 과정 (boring middle)을 자동화하십시오.

책임 소재 (accountability)를 자동화하지는 마십시오.

커리어에 미치는 영향은 무엇인가?

당신이 개발자, 마케터, 컨설턴트, 분석가, 에디터 또는 에이전시 운영자라면, 문제는 AI가 내일 당장 당신을 대체하느냐가 아닙니다.

당신의 업무가 고립된 작업 (isolated tasks)으로 패키징되어 있는지, 아니면 워크플로우 (workflow)로서 소유되고 있는지를 물으십시오.

작업 수행자 (Task executors)는 더 저렴한 작업 수행 방식과 비교됩니다.

워크플로우 소유자 (Workflow owners)는 그들이 운영할 수 있는 시스템의 가치와 비교됩니다.

이것이 바로 변화의 핵심입니다.

이제 당신의 시간은 토큰 (tokens)과 경쟁합니다. 하지만 판단력 (judgment), 시스템 사고 (systems thinking), 취향 (taste), 소스 규율 (source discipline), 그리고 워크플로우 소유권은 여전히 복리로 쌓입니다.

시장이 강제로 전환을 요구하기 전에, 작업 수행에서 워크플로우 소유로 이동하십시오.

FAQ

이것이 AI가 10만 달러짜리 직원을 2,730달러로 대체한다는 의미인가요?

아니요. 2,730달러라는 수치는 단순한 토큰 비용 (token-bill) 비교일 뿐, 모든 비용이 포함된 전체 워크플로우 비용 (fully loaded workflow cost)이 아닙니다. 유용한 비교를 위해서는 오케스트레이션 (orchestration), QA, 재시도 (retries), 도구 (tools), 모니터링 (monitoring), 그리고 인간의 승인이 포함되어야 합니다. [[1]]

GPT의 노출이 이미 직업 전체가 자동화되었음을 의미하나요?

아니요. 2023년의 더 안전한 해석은 작업 노출 (task exposure)입니다. 많은 근로자가 GPT에 의해 일부 작업이 영향을 받을 수 있지만, 이것이 직무 전체의 자동화 (full role automation)와 동일한 것은 아닙. \u274e

팀을 위한 실질적인 첫 번째 단계는 무엇인가요?

에이전트 (agent)를 추가하기 전에, 반복 가능한 워크플로우 (workflow)를 하나 선택하고 그 입력 (input), 허용된 소스 (allowed sources), 출력 (output), 품질 게이트 (quality gate), 승인 지점 (approval point), 그리고 측정 루프 (measurement loop)를 정의하십시오.

출처

[1] MeaningfulTech — The Token Economy: What a $100,000 Employee Really Costs in the Age of AI

[2] OpenAI / OpenResearch / University of Pennsylvania — GPTs are GPTs: An Early Look at the Labor Market Impact Potential of Large Language Models

[3] 내 사이트의 정식 버전 gregshevchenko.com