왜 AI는 우리를 덜 피곤하게 만드는 대신 더 피곤하게 만들까? 새로운 MIT 연구에 따르면 우리는 AI를 잘못 사용하고 있다

“왜 AI를 사용한 후에 더 피곤함을 느낄까?”

며칠 전 한 친구가 이에 대해 하소연했습니다. “예전에는 자리에 앉아 생각을 정리하고 반나절 만에 제안서를 완성하곤 했어. 그런데 이제는 AI에게 도움을 요청해. 물론 10초 만에 방대한 초안을 뱉어내긴 하지만, 그다음 30분 동안 사실 관계를 확인하고, 어색한 문장을 수정하고, AI가 아주 자신만만하게 지어낸 온갖 헛소리들을 바로잡는 데 시간을 써야 해. 이건 인공지능 (AI)이 아니야. 마치 끊임없이 옆에서 챙겨줘야 하는, 눈치 없는 인턴을 고용한 것 같아.”

많은 사람이 이 말에 공감할 것이라 생각합니다.

지난 2년 동안 우리는 끊임없는 AI 하이프 (Hype)에 둘러싸여 있었습니다. AI가 버튼 하나만 누르면 무엇이든 할 수 있다고 들어왔죠. 하지만 일상적인 업무의 현실에서 AI는 생산성 향상이라기보다 흐름을 깨뜨리는 번거로운 존재처럼 느껴질 때가 많습니다. 그렇다면 실제로 무슨 일이 일어나고 있는 걸까요? 우리가 단순히 AI를 잘 사용하지 못하는 걸까요, 아니면 AI가 우리가 들었던 것만큼 똑똑하지 않은 걸까요?

MIT, Yale, 그리고 Microsoft 연구진이 발표한 새로운 논문인 — Chaining Tasks, Redefining Work: A Theory of AI Automation (작업 체이닝, 업무의 재정의: AI 자동화 이론) — 은 문제의 핵심을 정확히 짚어냅니다.

이 논문의 핵심 주장은 직설적입니다. 만약 우리가 개별 작업의 효율성을 높이기 위해서만 AI를 사용한다면, 우리는 AI의 진정한 가치를 심각하게 과소평가하고 있는 것입니다.

그러니 학술적인 전문 용어는 건너뛰고, 이 논문이 밝혀낸 냉혹한 진실을 쉬운 언어로 이야기해 봅시다. 왜 실무에서 AI가 종종 좌절감을 주는지, 그리고 우리가 실제로 AI를 어떻게 사용해야 하는지에 대해서 말이죠.

대부분의 사람은 AI를 어떻게 사용하나요?

기사를 쓰는 것을 예로 들어봅시다: 구조 설계 (인간) ➔ 초안 생성 (AI) ➔ 수정 및 다듬기 (인간) ➔ 교정 (AI) ➔ 서식 지정 및 발행 (인간/AI).

문제가 보이시나요? 이러한 워크플로 (Workflow)에서는 작업이 인간과 AI 사이를 계속해서 왔다 갔다 하게 됩니다.

논문은 이러한 작업 단위별 (Task-by-task) AI 사용 방식이 거대한 함정을 숨기고 있다고 지적합니다. 바로 조정 및 검증 비용 (Coordination and verification costs)입니다.

AI로부터 작업물이 사람에게 다시 전달될 때마다, 우리는 그것을 읽고, 검토하고, 검증하고, 조정해야 합니다. 그 과정은 우리의 사고 흐름 (train of thought)을 끊고 주의력 (attention)을 소진시킵니다. 많은 경우, 사람들이 AI가 만들어낸 결과물을 정리하는 데 쓰는 시간은 AI가 처음에 절약해 준 시간을 이미 상쇄해 버립니다.

이것이 바로 AI를 사용하는 것이 마치 인턴을 관리하는 것처럼 느껴지는 이유입니다. 우리는 작업을 너무 작은 조각들로 잘게 나누었으며, 그로 인해 커뮤니케이션 (communication), 감독 (supervision), 그리고 수정 (correction)에 드는 비용이 치솟고 있습니다.

[IMG:1]

진정한 마법은 태스크 체이닝 (Task Chaining)에 있습니다
그렇다면 일회성 작업 보조가 정답이 아니라면, 무엇이 정답일까요? 연구진은 핵심적인 아이디어를 제시합니다. 바로 태스크 체이닝 (task chaining)입니다.

작업을 고립된 작업들의 집합으로 보는 대신, 우리는 이를 하나의 전체 파이프라인 (pipeline)으로 취급해야 합니다. 기업과 개인 모두에게 주어진 진정한 기회는 인접한 작업들을 하나로 묶어, AI가 중단 없이 처음부터 끝까지 전체 체인 (chain)을 실행하도록 하는 것입니다. 인간은 오직 마지막에 개입하여 최종 결과물을 검토해야 합니다.

이 논문은 아주 좋은 예시를 사용합니다. 바로 강의 (lecturing)와 튜터링 (tutoring)의 차이입니다. 얼핏 보면 둘 다 가르치는 형태이지만, AI 자동화의 잠재력은 완전히 다릅니다.

강의 기반 교수법 (Lecture-based teaching): 교사의 준비 작업은 연속적입니다 — 원본 자료 검토 ➔ 슬라이드 제작 ➔ 강의용 예시 생성. 이러한 작업들은 서로 인접해 있으며 긴밀하게 연결되어 있습니다. 이 전체 체인(chain)을 AI에게 맡겨 완전한 강의 패키지를 전달하게 할 수 있으며, 교사는 마지막에 검토만 하면 됩니다. 이를 통한 효율성 향상은 엄청날 수 있습니다.

튜터링 (Tutoring): 튜터링은 실시간 상호작용 루프(loop)입니다 — 교사가 설명 ➔ 학생이 질문 ➔ 교사가 학생의 반응에 따라 조정. 이러한 환경에서는 작업이 인간과의 상호작용에 의해 끊임없이 중단됩니다. 하나의 연속적인 작업 체인으로 쉽게 전환될 수 없기 때문에, AI의 자동화 가치는 훨씬 더 제한적입니다.

이는 기존의 많은 통념을 뒤집는 업무 설계 원칙으로 이어집니다: 작업이 어떻게 배치되는가는 작업 자체가 자동화될 수 있는지 여부만큼이나 중요합니다. 다시 말해, AI가 직업을 진정으로 변화시킬 수 있는지 여부는 종종 AI가 잘하는 부분들을 하나의 매끄러운 체인으로 엮어낼 수 있는지에 달려 있습니다.

엔드 투 엔드 (End-to-End) 자동화 파이프라인의 실제 사례
이 논문을 읽기 전에도, 저는 직접적인 실험을 통해 동일한 결론에 도달했습니다: AI의 진정한 힘을 끌어내고 싶다면, 인간과 기계 사이의 마찰이 큰 핸드오프 (handoff, 업무 인계)를 제거해야 합니다.

이러한 통찰을 바탕으로, 저는 샤오홍슈(Xiaohongshu/RedNote)의 이미지 및 텍스트 게시물을 생성하기 위한 워크플로 (workflow)를 설계하고 오픈 소스로 공개했습니다. 과거에는 게시물 하나를 만드는 것이 파편화된 작업의 연속이었습니다: 직접 원본 자료를 수집하고, AI에게 카피 작성을 요청하고, 수동으로 게시물 형식을 맞춘 다음, 다시 이미지를 위해 AI를 찾아가야 했습니다. 이는 마찰이 큰 워크플로의 교과서적인 정의였습니다.

그러한 마찰을 제거하기 위해, 저는 프로세스를 가능한 한 가장 작은 단계의 집합으로 나누고, 하나의 컨트롤러(controller)와 네 개의 독립적인 실행 모듈로 구성된 시스템을 구축했습니다:

소스 수집기 (Source collector): 스크립트가 크롤링 로직을 고정하고, 웹에서 콘텐츠를 가져와 유용한 정보를 추출하는 데에만 집중합니다. 이를 통해 AI가 가짜 뉴스나 허구의 사실을 만들어내는 환각 (hallucination) 현상을 방지합니다.
비즈니스 작가 (Business writer): 깨끗한 소스 초안을 받으면, AI는 오직 한 가지에만 집중합니다. 바로 그 자료를 강력한 헤드라인과 이모지, 그리고 적절한 인터넷 네이티브 톤 (internet-native tone)이 가미된 매력적인 소셜 카피로 변환하는 것입니다.
이미지 생성기 (Image generator): 이미지 API를 호출하고 파일을 저장하는 것과 같은 기계적인 부분은 워크플로 (workflow) 내에 하드코딩 (hard-coded)되어 있습니다. AI는 자신이 가장 잘하는 부분, 즉 아이디어 구상, 시각적 컨셉 설정, 그리고 아름다운 이미지를 위한 프롬프트 (prompt) 작성만을 담당합니다.
검토 및 저장 모듈 (Review-and-storage module): 마지막으로, 스크립트가 텍스트와 이미지를 자동으로 패키징하여 검토를 위해 Feishu/Lark 데이터베이스로 깔끔하게 전송합니다.
이 파이프라인 (pipeline)에서 하나의 컨트롤러 (controller) 스크립트가 이 네 가지 모듈을 순차적으로 실행합니다. 한 모듈의 출력이 자동으로 다음 모듈로 전달됩니다. 사람이 중간에 개입할 필요가 없습니다. 반복적이고 기계적인 작업은 표준 운영 절차 (SOPs)와 코드 내에 고정되는 반면, AI의 강점인 창의성과 해석 능력은 증폭됩니다.

이 시점에서 제가 해야 할 일은 프런트엔드 (front end)에 링크를 하나 넣는 것뿐이며, 그 후 커피 한 잔을 들고 결승선에 나타나 Feishu/Lark에서 최종 결과물을 승인하기만 하면 됩니다. 이것이 바로 해당 논문이 말하는 시스템 수준의 효율성입니다. 즉, 마찰을 제거하고, 인수인계 (handoffs)를 줄이며, 체인이 스스로 돌아가게 만드는 것입니다.

Press enter or click to view image in full size

이 지점에서 어떤 사람들은 당연한 질문을 던질 것입니다. 해당 파이프라인의 모든 단계가 실제로 인간보다 뛰어난 성능을 보이는가? 예를 들어, AI가 작성한 카피가 숙련된 편집자가 만든 것보다 항상 브랜드 정체성에 더 부합하거나 인터넷 트렌드에 더 능숙한가?

물론 아닙니다. 그리고 이는 이 연구에서 가장 직관에 어긋나면서도 가장 중요한 발견 중 하나로 이어집니다:

시스템 효율성이 국소적 완벽함보다 우세하다
많은 관리자와 완벽주의자들은 본능적으로 이 부분에서 반발합니다. 그들은 "AI는 충분히 정밀하지 않습니다. 데이터 수집에 있어서는 제 숙련된 직원이 AI보다 훨씬 낫습니다. 왜 전체 프로세스를 AI에게 맡겨야 합니까?"라고 말할 것입니다.

정답은 이것입니다: AI가 엄청난 가치를 창출하기 위해 모든 개별 작업에서 인간을 능가할 필요는 없습니다.

왜 그럴까요? 그 직원을 프로세스 체인의 중간에 투입하는 순간, 체인이 끊어지기 때문입니다. 그 사람이 데이터 수집을 마치고 나면, 이제 또 다른 인간-AI 간의 인수인계(handoff)가 발생합니다. 이는 또 다른 단계의 전송, 검증, 조정 및 수정 과정을 의미합니다.

논문은 이 점을 매우 명확하게 지적합니다: 설령 특정 중간 단계에서 인간이 AI보다 뛰어나더라도, 전체 작업 체인을 AI에게 맡기는 것이 여전히 더 합리적일 수 있습니다.

왜일까요? AI가 처음부터 끝까지 전체 과정을 처리하면, 마찰을 제거하고 인수인계 비용을 줄이며 전체 결과물의 속도를 극적으로 높일 수 있기 때문입니다. 비록 한 단계에서의 품질이 약간 떨어지더라도 말입니다. 여러분이 절약하는 것은 단순히 작업 자체에 드는 시간만이 아닙니다. 현대 업무에서 가장 비용이 많이 드는 자원 중 하나인 '인간의 조정 시간(human coordination time)'을 절약하는 것입니다.

이는 헨리 포드(Henry Ford)의 조립 라인과 매우 유사합니다. 개별적으로 보면, 라인 위의 작업자가 과거의 숙련된 장인과 같은 기술을 갖추지 못했을 수도 있습니다. 하지만 연속적인 시스템으로서 조립 라인은 압도적으로 더 강력했습니다. AI 시대에는 작업 수준의 완벽함(task-level perfection)보다 시스템 수준의 효율성(system-level efficiency)이 더 중요합니다.

업무 자체의 재정의
역사적으로 우리는 인간의 신체적, 정신적 한계에 맞춰 작업들을 그룹화함으로써 직업을 정의해 왔습니다. 이제 AI가 그 방정식을 다시 쓰고 있습니다.

논문은 AI 도입 초기 단계에서는 보상이 비용을 충당하지 못할 수도 있다고 지적합니다. 도구를 구매해야 하고, 프롬프팅(prompting)을 배워야 하며, 지저분한 인수인계를 견뎌야 하고, 모든 조정 오버헤드(coordination overhead)를 감수해야 합니다. 이것이 잘 알려진 생산성 J-커브(productivity J-curve)입니다.

하지만 그 임계점(threshold)을 넘어서는 순간 — 즉, AI를 단순히 미화된 타이핑 도구로 취급하는 것을 멈추고 AI를 중심으로 전체 워크플로(workflow)를 재설계하기 시작하면, 진정한 이득이 나타나기 시작합니다.

그러한 변화가 일어나면서 타이핑, 포맷팅(formatting), 그리고 일상적인 실행을 중심으로 구축된 전통적인 역할들은 압축될 것입니다. 미래의 업무는 누가 더 빨리 코딩을 하거나 더 예쁜 슬라이드를 만드느냐의 문제가 아니라, 누가 더 나은 시스템을 설계하고, 더 나은 기회를 포착하며, 더 나은 판단력(judgment)을 발휘하느냐의 문제가 될 것입니다.

만약 우리가 일상적인 작업들을 엔드 투 엔드(end-to-end) AI 작업 체인(task chains)으로 연결할 수 있다면, 우리는 여전히 인간에게 의존하는 더 높은 가치의 업무, 즉 복잡한 판단, 전략적 결정, 그리고 정서적 공명(emotional resonance)에 집중할 수 있도록 자유로워질 수 있습니다. 엄격한 자동화 워크플로(automated workflow)와 결합된 한 명의 개인은 이제 과거에 팀 전체가 필요했던 업무를 수행할 수 있습니다.

따라서 이제 질문은 더 이상 "AI가 어떻게 이 작업을 더 빨리 끝내도록 도와줄 수 있을까?"가 아닐지도 모릅니다.

진정한 질문은 다음과 같습니다: "이 워크플로를 인간의 개입이 거의 또는 전혀 없이 실행될 수 있는 AI 파이프라인(pipeline)으로 어떻게 재설계할 것인가?"

공장의 모터부터 벽면 콘센트에 이르기까지, 기술적 진보의 논리는 결코 변한 적이 없습니다. 세상은 빠르게 변하고 있습니다. AI는 이미 충분히 강력합니다. 지금까지 너무 작았던 것은 기술이 아니라, 우리가 AI에 부여한 역할입니다.

왜 AI는 우리를 덜 피곤하게 만드는 대신 더 피곤하게 만들까? 새로운 MIT 연구에 따르면 우리는 AI를 잘못 사용하고 있다

요약

핵심 포인트

댓글