AI는 인간의 검토 속도보다 빠르게 작성한다: 기업의 2배 생산성 명령에 대한 종단적 연구
요약
AI 코딩 도구 도입이 개발자의 생산성에 미치는 영향을 분석한 종단적 연구입니다. 기업의 '2배 생산성' 명령 이후 1인당 풀 리퀘스트 처리량이 약 2.09배 증가했음을 정량적으로 입증했습니다.
핵심 포인트
- AI 코딩 도구 도입 후 개발자 1인당 처리량이 2.09배 증가함
- AI는 생산성 향상의 직접적 동인이라기보다 촉매제 역할을 수행함
- 코드 리뷰 구조가 자동화 중심으로 재편되며 리뷰어당 부하가 증가함
- 생산성 이득은 연차와 관계없이 새로운 코드 작성에 집중됨
기업들은 점점 더 AI 코딩 도구 사용을 의무화하고 있으며 큰 생산성 향상을 보고하고 있지만, 이러한 명령이 어떻게 전개되는지에 대한 종단적(longitudinal) 증거는 부족합니다. 본 논문에서 우리는 2025년 중반부터 엔지니어당 병합된 풀 리퀘스트(pull request) 수를 두 배로 늘리는 것을 목표로 삼아온, AI 중심의 중견 기업에서 문서화된 '2배(2x)' 명령에 대한 정량적 사례 연구를 제시합니다. 802명의 개발자와 196,212개의 풀 리퀘스트(2024년 1월~2026년 4월)를 대상으로 한 패널 연구 결과, 1인당 처리량은 결국 두 배로 증가하여 2026년 4월에는 명령 시행 전 기준점 대비 2.09배에 도달했습니다. 이는 우리가 알고 있는 범위 내에서 AI 코딩 도구의 현장 배포를 통해 보고된 가장 큰 이득 중 하나입니다. 시차 이중차분(staggered difference-in-differences) 설계를 통해 이러한 이득의 개발자 내 점유율을 AI 도입 및 누적 사용량에 따라 증가하는 추가적인 이득과 연결하였으며, 이 과정에서 명령은 직접적인 동인(driver)이라기보다 촉매제(catalyst) 역할을 했습니다. 도입과 사용 강도가 무작위로 할당되지 않았기 때문에, 우리는 이 증거를 정확한 인과적 귀속보다는 도입 및 사용 채널(adoption-and-use channel)을 강력하게 시사하는 것으로 해석합니다. 이득은 연차에 관계없이 폭넓게 공유되었으나 새로운 코드에 집중되었으며, 모델 세대별로는 구분되지 않았습니다. 또한 도입은 자동화를 중심으로 코드 리뷰 구조를 재편했습니다. 리뷰어당 부하(per-reviewer load)는 대략 두 배로 증가했고 자동화된 리뷰가 인간의 리뷰를 추월한 반면, 병합(merge) 및 되돌리기(revert) 비율은 안정적으로 유지되었습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv Codex (cs.SE)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기