arXiv논문2026. 06. 09. 10:53

거친 코드 이해 여정을 통한 SWE 에이전트의 발현되는 사고방식 투영

요약

SWE 에이전트의 도구 사용 궤적을 분석하여 그들의 사고방식을 가시화하는 연구를 소개합니다. 새로운 프레임워크 Ada를 통해 에이전트의 탐색, 증거 선택, 중단 결정을 관찰 가능한 데이터로 변환하여 행동 프로필을 생성합니다.

핵심 포인트

SWE 에이전트의 행동을 규정하기 위한 관찰 방법론 제시
코드 이해를 위한 제한적 장치 Ada 프레임워크 소개
사고-행동 체인을 가시화하는 관찰 렌즈 개발
408개 궤적 분석을 통한 에이전트 행동 프로필 생성

소프트웨어 엔지니어링 에이전트 (SWE agents)는 실제 저장소 (repositories) 내에서 도구 매개 궤적 (tool-mediated trajectories)을 통해 점점 더 많이 작업하고 있지만, 이들의 행동을 구체적이고 관찰 가능한 용어로 규정하는 것은 여전히 어렵습니다. 이러한 궤적은 도구 사용 (tool use), 중간 추론 (intermediate reasoning), 증거 선택 (evidence selection), 그리고 자기 주도적 중단 (self-directed stopping)을 기록하지만, 그 자체만으로는 왜 특정 움직임이 선택되었는지, 어떤 증거가 신뢰되었는지, 또는 언제 이해가 충분하다고 판단되었는지를 설명하지 못합니다. 이러한 긴장 상태는 궤적 데이터를 제한적이면서도 가치 있게 만듭니다. 즉, 규율 있는 관찰 (disciplined observation)을 통해 해석될 때, 충실하고 재현 가능한 흔적 (traces)은 에이전트 행동을 연구하기 위한 경험적 기질 (empirical substrate)이 될 수 있습니다.

우리는 저장소 수준의 코드 이해 (code understanding)를 위한 범위 제한적 장치 (scoped apparatus)인 Ada를 소개합니다. Ada는 제한된 도구 인터페이스 (tool interface)를 통해 실제 코드베이스 (codebases)에 진입하며, 이를 통해 개방형 탐색 (open-ended exploration)이 유한한 궤적으로 기록될 수 있도록 유지합니다. 이 거칠지만 제한된 환경 (wild-but-bounded setting) 전반에 걸쳐, Ada는 어디를 볼지, 무엇을 자세히 읽을지, 언제 부분적인 이해를 통합할지, 그리고 언제 저장소에 대한 설명을 마칠지를 결정합니다. 우리는 탐색 (navigation), 증거 선택 (evidence selection), 합성 (synthesis), 근거 제시 (grounding), 그리고 중단 (stopping)을 단순한 도구 사용 횟수로 축소하거나 숨겨진 의도를 추측하지 않고도 가시화할 수 있는 관찰 렌즈 (observation lenses)를 통해 Ada의 사고-행동 체인 (think-action chains)을 투영합니다. 이 렌즈들을 함께 읽으면 소프트웨어 세계를 통한 기록된 움직임에 기반한 행동 프로필 (behavioral profiles)을 생성할 수 있습니다.

다양한 모델, 저장소, 작업군 및 실행 조건에 걸친 408개의 궤적을 통해, 본 연구는 충실한 디지털 흔적이 어떻게 발현되는 SWE 에이전트 사고방식 (SWE-agent mindset)에 대한 규율 있고 비교 가능한 투영으로 변환될 수 있는지를 보여줍니다. 결과는 효율성 (efficiency), 궤적 다양성 (trajectory diversity), 인식론적 근거 (epistemic grounding), 그리고 개입의 한계 (limits of intervention)에서의 차이점을 드러내는 동시에, 실제 코드베이스에서 SWE 에이전트 행동을 관찰하기 위한 방법론적 토대를 제공합니다.

AI 자동 생성 콘텐츠

원문 바로가기

거친 코드 이해 여정을 통한 SWE 에이전트의 발현되는 사고방식 투영

요약

핵심 포인트

댓글