요구사항과 아키텍처의 가교: 외부 지식 및 계층적 메모리를 활용한 멀티 에이전트 오케스트레이션
요약
MAAD는 요구사항을 다중 뷰 아키텍처 청사진으로 변환하기 위해 4개의 특화된 에이전트를 활용하는 지식 기반 프레임워크입니다. RAG와 계층적 메모리를 통합하여 아키텍처 표준을 준수하고 설계 이력을 관리하며, 자동화된 품질 평가를 제공합니다.
핵심 포인트
- Analyst, Modeler, Designer, Evaluator 4종 에이전트 오케스트레이션
- RAG를 통한 아키텍처 표준 및 패턴 주입
- 계층적 메모리 메커니즘으로 설계 이력 관리 및 반복 개선
- MetaGPT 대비 높은 완전성, 모듈화, 추적성 입증
- LLM의 추론 능력에 따른 아키텍처 품질 의존성 확인
소프트웨어 아키텍처 설계 (Software architecture design)는 상충하는 품질 속성 (quality attributes) 사이의 균형을 맞추고 진화하는 요구사항에 적응해야 하는, 매우 중요하면서도 본질적으로 복잡하고 지식 집약적인 단계입니다. 전통적으로 이 과정은 시간이 많이 소요되고 노동 집약적이며 아키텍트에게 크게 의존해 왔으며, 특히 애자일 개발 (agile development)의 압박 속에서 대안적인 아키텍처 분해 (architectural decompositions) 및 스타일을 탐색하는 데 한계가 있는 경우가 많았습니다. LLM 기반 에이전트 (LLM-based agents)가 다양한 소프트웨어 공학 작업에서 유망한 성능을 보여주었지만, 아키텍처 설계에 대한 적용은 여전히 상대적으로 드물며 체계적인 탐색이 필요합니다. 이러한 과제를 해결하기 위해, 우리는 요구사항 명세 (requirements specifications)를 품질 속성 평가가 포함된 포괄적인 다중 뷰 아키텍처 청사진 (multi-view architectural blueprints)으로 자율적이고 협력적으로 변환하기 위해 네 가지 특화된 에이전트(즉, Analyst, Modeler, Designer, Evaluator)를 오케스트레이션하는 지식 기반 프레임워크인 MAAD (Multi-Agent Architecture Design)를 제안합니다. MAAD는 RAG (Retrieval-Augmented Generation)를 통합하여 공인된 아키텍처 표준 및 패턴을 워크플로에 주입하며, 반복적인 개선을 위해 설계 이력을 포착하는 계층적 메모리 (hierarchical memory) 메커니즘을 활용합니다. 우리는 10개의 사례 연구에 걸친 정량적 아키텍처 수준 지표와 10개의 실제 명세에 대한 산업계 아키텍트들의 정성적 피드백을 사용하여 MetaGPT와 비교 실험을 통해 MAAD를 평가했습니다. 결과에 따르면 MAAD는 베이스라인보다 더 완전하고, 모듈화되어 있으며, 추적 가능한 아키텍처를 생성하며, 전용 Evaluator 에이전트가 구조화된 품질 평가 보고서를 자율적으로 생성하여 수동 검증 노력을 크게 줄여줍니다. 또한, 생성된 아키텍처의 품질은 기반이 되는 LLM의 추론 능력에 크게 의존하며, GPT-5.2와 Qwen3.5가 대부분의 평가 설정에서 다른 모델보다 뛰어난 성능을 보임을 확인했습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv Codex (cs.SE)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기