Code2UML: 확장 가능한 소프트웨어 시각화를 위한 컨텍스트 엔지니어링 기반의 에이전트형 LLM
요약
Code2UML은 대규모 코드베이스를 분석하여 UML 다이어그램을 자동 생성하는 에이전트형 LLM 아키텍처를 제안합니다. 컨텍스트 엔지니어링과 5개의 특화된 에이전트 계층을 통해 토큰 제한 문제를 해결하고 확장성을 확보했습니다.
핵심 포인트
- Claude Agent SDK 기반의 5개 특화 에이전트 계층 활용
- IR 압축 레이어를 통한 토큰 제한 및 확장성 문제 해결
- Java, Python 등 4개 언어 및 7개 UML 유형에 대한 높은 유효성 입증
- 규모와 관계없이 안정적인 구조적 품질 유지 확인
대규모 언어 모델 (LLM) 기반의 코드 분석 도구는 소프트웨어 문서화 작업을 자동화하기 위해 채택되고 있습니다. 그러나 중간 표현 (Intermediate Representations, IR)이 LLM의 컨텍스트 제한을 초과하는 실제 코드베이스에 대한 이러한 접근 방식의 확장성은 여전히 미개척 분야로 남아 있습니다. 본 논문은 소스 코드 저장소로부터 UML 다이어그램을 자동으로 생성하기 위해 컨텍스트 엔지니어링 (context engineering)을 결합한 에이전트형 아키텍처를 소개합니다. 이 시스템은 Claude Agent SDK를 기반으로 구축된 PlannerAgent, AnalyzerAgent, DiagramAgent, CorrectorAgent, DependencyAnalyzerAgent라는 5개의 특화된 에이전트 계층을 사용하며, 각 에이전트는 서로 다른 인지적 하위 작업을 처리합니다. 결정론적이고 중요도 가중치가 적용된 IR 압축 레이어는 전체 프로젝트의 IR을 토큰 제한 내에 들어갈 것이 보장되는 다이어그램 특화 뷰로 변환하며, 이는 LLM 호출을 필요로 하지 않고 밀리초 단위로 완료됩니다. 따라서 우리는 4가지 프로그래밍 언어 (Java, JavaScript, PHP, Python)와 7가지 UML 다이어그램 유형에 걸친 12개의 오픈 소스 저장소를 대상으로 시스템을 평가하였으며, 5가지 자동화된 지표를 통해 평가된 84개의 관측치를 생성했습니다. 결과는 높은 구문 유효성 (평균: 91.5%, 컴포넌트 및 배포 다이어그램은 100% 도달), 강력한 관계 정밀도 (평균: 0.858), 그리고 일관된 구조적 품질 (평균: 81.7/100, 언어 간 분산 3.1포인트)을 입증했습니다. 엔티티 재현율 (Entity recall)은 평균 0.313이었으며, 이는 철저한 포괄성보다는 의도적인 아키텍처 우선순위 설정을 반영합니다. 민감도 분석 (31개에서 4,578개의 IR 엔티티)을 통해 규모와 관계없이 품질 점수가 안정적으로 유지됨을 확인했습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv Codex (cs.SE)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기