AI로 인한 일자리 종말론은 계속해서 일어나지 않고 있습니다. 그 수학적 근거를 공개합니다.

이제 AI가 제 코드의 대부분을 작성합니다. 제가 함께 일하는 모든 사람의 코드 대부분도 AI가 작성하고 있습니다. 지난 2년 동안 컨퍼런스 무대에서 이루어진 모든 약속대로라면, 우리는 세 배 더 빠르게 제품을 출시해야 하고, 팀 규모는 3분의 1로 줄어야 하며, 우리 중 상당수는 LinkedIn 프로필을 저주받은 초록색 원이 있는 "구직 중(open to work)" 상태로 업데이트하고 있어야 합니다.

독자 여러분, 유감스럽게도 아무 일도 일어나지 않았음을 알려드립니다.

"아직은 아니다"라거나 "곡선이 곧 꺾일 것이니 로드맵을 믿어라"라는 말이 아닙니다. 그것은 측정 가능한 수준으로 일어나지 않았습니다 — 그리고 그 이유는 단순한 과장(hype)이나 공포(panic)보다 훨씬 더 흥미롭습니다. 또한 이는 양측 모두 파티에서 소리 내어 말하고 싶어 하지 않는 부분이기도 합니다: 우리는 소프트웨어의 저렴한 부분을 자동화했지만, 그 저렴한 부분은 결코 병목 현상(bottleneck)이 아니었습니다.

수학적 근거를 보여드리겠습니다. 그런 다음 기원전 200년의 지치지 않는 1,000명의 노동자에 관한 이야기를 들려드리겠습니다. 이 이야기는 누군가가 마이크를 잡고 아무리 자신 있게 말하더라도, 왜 "저렴한 노동력"과 "더 부유한 경제"가 결코 같은 문장이 될 수 없는지를 설명해 줄 것입니다.

당신이 주문한 종말 vs 실제로 배송된 종말

예측은 종말론적이었고 매우 구체적이었습니다. 대규모 실직. 화이트칼라(White-collar)의 멸종. 당신의 이름이 적힌 실업의 시대. 따라서 종말론자(Team Doom)들에게는 다소 난처한 부분이 있습니다: 2년 이상이 지난 지금, 집계된 데이터는 대체로 이를 뒷받침하지 않습니다.

Anthropic의 자체 노동 시장 연구 — 네, 맞습니다, 이 회사는 바로 그 기술을 만드는 회사입니다 — 에 따르면, 2022년 말 이후 AI 노출도가 높은 노동자들의 실업률이 체계적으로 상승하지 않았음을 발견했습니다. Yale의 Budget Lab은 실업자들 사이에서도 이전 직업이 AI에 얼마나 노출되어 있었는지에 대한 명확한 상승 추세가 없음을 발견했습니다. Dallas Fed는 AI 노출 직종의 임금을 확인했으며, 임금이 일률적으로 하락하지 않는다는 것을 발견했습니다 — 이는 AI가 사람을 대체하는 대신 사람을 *보조(augmenting)*하고 있다면 정확히 예상할 수 있는 결과입니다.

나중에 종말론이 실제로 나타나고 있는 단 한 곳에 대해 솔직하게 말씀드리겠습니다 (그것은 실재하며, 만약 당신이 주니어라면 바로 당신을 정조준하고 있습니다). 하지만 "기계가 모든 일자리를 가져갔다"는 것은 수치가 말해주는 바가 아닙니다. 그렇다면 왜 아닐까요? 마음 단단히 먹으세요, 이제부터 기술적인 부분입니다.

이유 1: 벤치마크는 직업이 아니다

"AI가 N명의 엔지니어 몫을 한다"는 모든 주장은 멋진 정장을 차려입은 범주 오류 (category error)에 기반하고 있습니다. 이는 AI가 수행하는 **태스크 (tasks)**를 측정하고 나서, AI가 **직업 (jobs)**을 수행할 수 있다고 발표하는 것입니다. 이 둘은 서로 다른 것이며, 그 사이의 간극이 승부의 핵심입니다.

모델은 코딩 벤치마크를 통과하고, 리트코드 (LeetCode) 문제를 원샷 (one-shot)으로 해결하며, 당신이 커피를 다 마시기도 전에 CRUD 엔드포인트를 마법처럼 만들어낼 수 있습니다. 그것은 업무의 첫 70~80%에 해당하며, 데모의 간극을 즉각적으로 메워주기 때문에 마치 마법처럼 느껴집니다. 하지만 제품을 출시하는 것 (shipping)은 데모가 아닙니다. 데모는 운 좋은 날, 우호적인 청중 앞에서 단 한 번만 실행되면 됩니다. 하지만 프로덕션 코드 (production code)는 부하가 걸린 상태에서, 인증 (auth)을 거쳐, 아무도 기록하지 않은 엣지 케이스 (edge cases)에 대응하며, 정확히 한 명의 시니어 엔지니어의 머릿속에만 들어있는(그리고 그분은 지금 휴가 중인) 10년 동안 축적된 컨텍스트 (context)와 암묵적 규칙이 살아있는 시스템 내부에서 수백만 번 실행되어야 합니다.

마지막 20~30% — 정확성, 통합, 저주받은 레거시 제약 조건, 그리고 새벽 3시에 페이지 (page) 알람이 울릴 때 책임을 지는 사람으로서의 역할 — 이 부분에 대부분의 시간과 거의 모든 비용이 들어갑니다. 그리고 이것이 바로 AI가 가장 못하는 부분인데, 왜냐하면 AI에게는 의도 (intent)가 없기 때문입니다. AI는 당신이 실제로 무엇을 의도했는지 알지 못합니다. AI는 그럴듯하지만 틀린 결과물을 쾌활하게 건네줄 것이고, 이제 인간은 그것을 읽고, 이해하고, 신뢰할지 여부를 결정해야 합니다. 직업은 하나씩 넘겨줄 수 있는 독립적인 태스크의 더미가 아닙니다. 그것은 상호 의존적인 판단의 시스템이며, 시스템을 자동 완성 (autocomplete) 기능만으로 헤쳐 나갈 수는 없습니다.

이유 2: 비용은 결과와 거의 상관이 없습니다

이것은 제가 가장 과소평가되었다고 생각하는 논거이기에, 굵게 표시한 뒤 조심스럽게 강조해 보겠습니다.

코드 한 줄을 생성하는 한계 비용 (marginal cost)은 0에 가깝게 붕괴하고 있습니다. 그 부분의 과장된 이야기는 진심으로 사실입니다. 하지만 소프트웨어 프로젝트는 코드 생성 비용에 의해 제약을 받는 것이 결코 아니었습니다. 프로젝트를 제약하는 것은 AI가 건드리지 못하는 것들입니다:

무엇을 만들지 아는 것. 소프트웨어에서 비용이 많이 드는 실패 모드 (failure mode)는 잘못된 것을 효율적으로 만드는 것입니다. AI는 단지 훌륭한 테스트 커버리지 (test coverage)를 갖춘 채로, 당신이 잘못된 것을 더 빠르게 만들도록 도울 뿐입니다.
조정 (Coordination). 브룩스의 법칙 (Brooks's Law)은 폐지되지 않았습니다. 통신 오버헤드 (communication overhead)는 시스템을 다루는 에이전트(agent)의 수 — 인간이든 혹은 로봇이든 — 에 따라 증가합니다. 더 많은 출력물은 더 많은 일을 완료하는 것이 아니라, 조정해야 할 것이 더 많아짐을 의미할 수 있습니다.
검증 (Verification). 생성된 코드가 정확하고, 안전하며, 유지보수 가능한지 확인하는 누군가가 반드시 필요합니다. 생성이 저렴해질수록, 돌봐야 할 대상은 더 많아집니다.
통합 및 유지보수 (Integration and maintenance). 코드는 한 번 생산하고 끝나는 트로피가 아니라, 영원히 관리해야 하는 부채 (liability)입니다.

타이핑 비용을 90% 낮추더라도 프로젝트는 대략 비슷한 속도와 비슷한 성공률로 진행됩니다. 왜냐하면 구속 조건 (binding constraint)은 내내 다른 곳에 있었기 때문입니다. 우리는 저렴한 부분을 더 저렴하게 만들고 나서, 청구서 금액이 변하지 않은 것에 놀란 척을 하고 있습니다. 투입 비용과 프로젝트 결과는 거의 상관관계가 없습니다 — 그리고 "그냥 더 많은 역량을 투입하면 돼!"라고 외치던 프로젝트가 처참히 실패하는 것을 지켜본 시니어라면 누구나 이를 뼈저리게 알고 있습니다. AI는 새로운 "더 많은 역량"일 뿐입니다. 바위가 잘못된 벽에 막혀 있다면, 그 바위에 얼마나 많은 손이 붙어 있는지는 중요하지 않습니다.

이유 3: 생산성 향상이 지표에 나타나지 않습니다

만약 개별 개발자들이 이제 훨씬 더 빨라졌다면, _팀_의 수치에서는 어디에 나타나 있습니까? 사이클 타임 (cycle time), 배포 빈도 (deploy frequency), 결함률 (defect rate), 출시 시간 (time-to-ship) — 대부분의 팀에서 이 지표들은 거의 움직이지 않았습니다. 이것은 단순한 느낌이 아닙니다. 우리는 마침내 증거를 확보했습니다.

2025년 7월, METR은 무작위 대조 실험 (Randomized Controlled Trial)을 실시했습니다. 이는 희망적인 헤드라인을 내세운 벤더 설문조사가 아니라, 임상 시험의 황금 표준 (Gold Standard)입니다. 16명의 숙련된 오픈 소스 개발자들이 참여했으며, 그들의 성숙한 저장소(평균 100만 줄 이상의 코드)에서 추출한 246개의 실제 작업을 대상으로 했습니다. 각 작업은 AI 도구(주로 Claude가 탑재된 Cursor Pro)의 사용을 허용하거나 금지하도록 무작위로 할당되었습니다. 그 결과는 다음과 같습니다 (전체 논문은 여기):

AI를 사용한 개발자들은 19% 더 오래 걸렸습니다. 그들은 AI가 자신들을 24% 더 빠르게 만들어 줄 것이라고 예측했습니다. 그리고 더 느리게 작업을 마친 이후에도, 그들은 여전히 AI가 자신들의 속도를 약 20% 높여주었다고 믿었습니다.

이 사실을 곱씹어 보십시오. 이러한 인식의 격차는 단순한 반올림 오차가 아닙니다. 그것은 본격적인 환각 (Hallucination)이며, 이번에는 인간이 그 환각을 일으키고 있습니다. 도구는 빠르게 느껴집니다 (타이핑을 덜 하니까요! 도구가 무언가를 해내고 있으니까요!). 하지만 스톱워치는 조용히 다른 결과를 보여줍니다. 시간은 그저 재배치될 뿐이기 때문입니다. 코드를 작성하는 시간은 줄어들지만, 읽고, 프롬프팅 (Prompting)하고, 검토하고, 자신만만한 헛소리를 정중하게 수정하는 데 더 많은 시간을 쓰게 됩니다.

논점을 더 강화하기 위해 두 가지 솔직한 주의 사항을 덧붙입니다. 첫째, 이것은 2025년 초의 툴링(tooling) 기준이었으며, 속도 저하는 '이미 알고 있는 코드를 작업하는 전문가'들에게서 가장 크게 나타났습니다. 이들에게 AI는 주로 마찰(friction) 요인일 뿐인데, 이미 머릿속에 답이 있기 때문입니다. 반면 익숙하지 않은 코드를 다루는 주니어(Juniors)들은 종종 진정한 마법을 느낍니다. 둘째, 최신 도구들에 대한 METR의 자체적인 2026년 2월 후속 연구는 명확한 신호를 얻지 못했으므로, 제가 '19% 더 느려짐'이 물리 법칙인 것처럼 가장하지는 않겠습니다. 하지만 논쟁의 여지가 없는 사실은 다음과 같습니다: 우리가 확보한 유일한 엄격한 무작위 대조 실험(RCT)에서는 속도 저하가 발견되었으며, 기조연설에서 약속했던 팀 단위의 혁신적인 속도 향상을 입증할 엄격한 증거는 아무도 제시하지 못했습니다. 연구소에서 나온 연구조차 AI의 지원이 평균적인 효율성 향상을 가져오지 못하는 동안 개념적 이해와 디버깅(debugging) 능력을 저해할 수 있음을 발견했습니다.

하지만 가장 근본적인 이유는 단순한 산술적 문제입니다. 이를 소프트웨어 배포를 위한 암달의 법칙(Amdahl's Law)이라고 부릅시다. 만약 코드 작성(writing code)이 전체 엔드 투 엔드(end-to-end) 전달 시간의 30%를 차지한다면, 코딩을 '무한히' 빠르게 만든다 해도 전체 파이프라인(pipeline)은 기껏해야 30%만 개선됩니다. 나머지 70%인 계획, 검토(review), QA, 배포(deploys), 의존성 대기, 회의를 잡기 위한 회의 등은 전혀 영향을 받지 않습니다. 게다가 상황은 더 악화됩니다. 한 단계를 가속화한다고 해서 병목 현상(bottleneck)이 '제거'되는 것이 아니라, '이동'할 뿐입니다. 코드를 5배 더 빠르게 생성하면, 여러분의 검토 대기열(review queue)이 새로운 교통 체증이 됩니다. 더 많은 PR(Pull Request), 더 넓은 공격 표면(surface area), 분류해야 할 더 많은 버그가 생깁니다. 출력(Output)은 늘어났지만, 결과(Outcome)는 늘어나지 않았습니다. 코드 라인 수(Lines of code)는 소설을 킬로그램(kg) 단위로 측정하는 것과 마찬가지로 언제나 허영 지표(vanity metric)였습니다.

한편, 경영진들은 실적 발표 전화(earnings calls)에서 분석가들에게 자사의 최고 엔지니어들이 몇 달 동안 코드를 직접 작성하지 않았으며, 단지

이제 경제학적인 측면입니다 — 그리고 이 부분은 제가 정말로 생각을 멈출 수 없는 지점입니다. 잠시 코드는 잊어버리세요. 한번 상상해 보십시오.

기원전 200년입니다. 당신은 1,000명의 노동자를 소유하고 있습니다. 그들은 꿈의 노동력입니다. 그들은 먹지도 않고, 잠을 자지도 않으며, 불평하지도 않고, 그만두지도 않으며, 노조를 결성하지도 않고, 다시 논의하자고(circle back) 하지도 않습니다. 당신이 비용을 지불하면, 그들은 하루 종일, 영원히 당신이 말하는 대로 정확히 수행합니다. 당신의 빌라, 당신의 도로

건강한 경제에서 노동자는 단순한 생산자가 아닙니다. 그들은 고객이기도 합니다. 임금은 허공으로 사라지는 비용이 아닙니다. 그것은 ‘소비(spent)’되며, 그 소비는 다른 누군가의 수익이 되고, 이는 다시 다른 누군가의 임금이 됩니다. 경제학자들은 이를 소득의 순환 흐름 (circular flow of income)이라고 부르며, 여기에 승객처럼 동승한 승수 효과 (multiplier)가 작용합니다. 즉, 지역 사회에서 소비되고 재소비되는 1달러의 임금은 수 달러의 경제 활동을 뒷받침합니다. 이러한 순환 ‘그 자체’가 경제입니다. Henry Ford는 1세기 전, 노동자들의 임금을 두 배로 인상하며 이를 증명했습니다. 이는 부분적으로 노동자들이 자신들이 만드는 자동차를 실제로 살 여력이 있게 만들기 위함이었습니다. 수요는 반드시 어딘가에 존재해야 합니다.

AI “노동자”는 자신의 코인을 해외로 실어 나르는 노예와 같습니다. 그것은 경이로운 생산자이지만, 완벽하게 무용지물인 소비자입니다. 당신이 지역 제빵점이나 지역의 모든 곳에서 소비했을 사람에게 지급했을 “임금”은, 대신 소수의 지리적으로 집중된 연구소(labs)와 그 주주들에게 흘러 들어가는 구독료나 API 비용이 됩니다. 그 돈은 대부분 그곳에 머물며 곧바로 더 많은 컴퓨팅 자원 (compute)에 재투자됩니다. 이 돈은 급여가 가진 속도만큼 광범위한 소비자 수요로 재순환되지 않습니다. 우화의 언어를 빌리자면, 금은 바다를 건너 항해하며 집으로 돌아오는 길을 잊어버립니다.

AI로 인한 일자리 종말론은 계속해서 일어나지 않고 있습니다. 그 수학적 근거를 공개합니다.

요약

핵심 포인트

당신이 주문한 종말 vs 실제로 배송된 종말

이유 1: 벤치마크는 직업이 아니다

이유 2: 비용은 결과와 거의 상관이 없습니다

이유 3: 생산성 향상이 지표에 나타나지 않습니다

댓글