에이전트형 AI 코딩 도구의 설정이 Build-vs-Buy 결정에 미치는 영향: 연구 프로토콜
요약
에이전트형 AI 코딩 도구가 라이브러리 사용(Buy)과 직접 구현(Build) 사이에서 내리는 결정에 영향을 미치는 설정 메커니즘을 연구하는 프로토콜을 제시합니다. Claude Code와 OpenAI Codex를 대상으로 다양한 설정 환경에서 도구의 동작 변화를 실험하고 벤치마크 데이터셋을 공개할 예정입니다.
핵심 포인트
- 에이전트형 AI의 Build-vs-Buy 결정이 보안 및 유지보수에 미치는 영향 분석
- Claude Code 및 OpenAI Codex를 활용한 통제된 실험 설계
- 설정 메커니즘(MCP, 권한 제어 등)이 도구의 선택에 미치는 효과 측정
- 재사용 가능한 벤치마크 데이터셋 및 분석 파이프라인 공개 예정
에이전트형 AI (Agentic AI) 코딩 도구는 점점 더 높은 자율성을 가지고 코드를 작성하며, 그 과정에서 라이브러리를 가져올지 아니면 기능을 처음부터 직접 구현할지를 결정합니다. 기능을 처음부터 직접 만들 것인지(build) 아니면 외부 라이브러리를 사용할 것인지(buy)에 대한 이러한 결정(이하 build-versus-buy)은 소프트웨어 보안, 라이선스 준수, 성능 및 장기적인 유지보수 가능성에 직접적인 영향을 미칩니다. 그러나 에이전트형 AI 코딩 도구에서 build-versus-buy 결정을 무엇이 지배하는지를 조사한 통제된 실험 연구는 아직 없습니다. 설정 메커니즘(Configuration mechanisms), 즉 개발자가 프로젝트나 워크플로우에 맞게 에이전트형 AI 코딩 도구의 동작을 맞춤화하는 수단은 실무자가 이러한 결정에 영향을 미칠 수 있는 주요 수단 중 하나입니다. 하지만 어떤 설정 메커니즘이 build-versus-buy 결정에 가장 효과적으로 영향을 미치는지는 불분명합니다. 본 연구에서는 두 가지 대중적인 에이전트형 AI 코딩 도구인 Claude Code와 OpenAI Codex에서 설정 메커니즘이 build-versus-buy 동작을 어떻게 변화시키는지 연구하기 위한 사전 등록된 프로토콜을 제시합니다. 우리는 식별 가능한 build-versus-buy 지점을 중심으로 구축된 단계별 프로젝트 벤치마크에서 추출한 통제된 프로그래밍 과제를 수행할 것이며, 각 도구에 제공되는 설정을 '설정 없음'부터 '부드러운 선호도 및 명시적 금지 사항이 포함된 컨텍스트 파일', 'Skills(자율적으로 발견 가능한 지침)', 'MCP(Model Context Protocol) 기반 라이브러리 발견 도구', 그리고 '권한 제어'에 이르기까지 다양하게 조작할 것입니다. 이를 통해 도구가 어떤 라이브러리를 선택하는지, 새로 도입된 라이브러리를 공개하는지, 그리고 그러한 공개가 완전하고 정확한지를 측정할 것입니다. 본 프로토콜은 9개의 사전 등록된 가설로 구성됩니다. 결과물인 벤치마크 데이터셋과 분석 파이프라인은 에이전트형 AI 코딩 도구의 build-versus-buy 동작을 평가하기 위한 재사용 가능한 아티팩트(artifact)로 공개될 예정입니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기