arXiv논문2026. 05. 07. 12:45

Design Conductor 2.0: 에이전트가 80 시간 만에 TurboQuant 추론 가속기를 구축합니다

요약

LLM 에이전트의 발전은 하르네스(harness)와 기반 모델의 빠른 공진화에 힘입어 놀라운 속도로 진행되고 있습니다. 이번 연구에서 소개된 업데이트된 다중 에이전트 시스템인 'Design Conductor 2.0'은 이전보다 훨씬 큰 작업을 처리하며, 완전히 자율적으로 작동할 수 있는 높은 품질을 보여줍니다. 이 시스템은 LLM 추론 가속기(VerTQ)를 포함하여, 복잡한 하드웨어 설계를 80시간 만에 성공적으로 구축하고 FPGA에 매핑하는 성과를 입증했습니다.

핵심 포인트

Design Conductor 2.0은 업데이트된 다중 에이전트 시스템으로, 이전 버전보다 훨씬 크고 복잡한 작업을 처리할 수 있습니다.
시스템은 LLM 추론 가속기(VerTQ)와 같은 실제 하드웨어 설계를 완전히 자율적으로 생성하고 구축했습니다.
구축된 VerTQ는 240 사이클 파이프라인을 가진 LLM 추론 가속기로, FPGA에 매핑되어 구체적인 성능 지표를 보여줍니다.
연구는 에이전트 시스템의 성공 사례와 함께 토큰 사용량 및 한계점 등 경험적 분석도 제공합니다.

하르ネス (harness) 과 기반 모델의 빠른 공진화 (co-evolution) 에 의해 주도되어, LLM 에이전트는 놀라운 속도로 발전하고 있습니다. 우리 이전 작업 (2025 년 12 월 수행) 에서 우리는 "Design Conductor" (또는 단순히 "Conductor") 를 소개했습니다. 이 시스템은 12 시간 만에 5 단계 Linux-capable RISC-V CPU 를 구축할 수 있었습니다. 이번 작업에서는 2026 년 4 월에 출시된 프론티어 모델 (frontier models) 에 의해 구동되는 업데이트된 다중 에이전트 하르ネス을 소개합니다. 이 하르ネス은 80 배 더 큰 작업을 처리하며, 더 높은 품질로 완전히 자율적으로 작동할 수 있습니다. 간단한 소개를 마친 후, 시스템이 자율적으로 생성한 4 가지 설계 (designs) 를 검토합니다. 이는 "VerTQ"를 포함하며, TurboQuant arXiv 논문에서 시작하여 TurboQuant 을 하드와이어 (hard-wires) 지원하는 240 사이클 파이프라인을 가진 LLM 추론 가속기입니다. VerTQ 는 중대한 컴퓨팅 처리 (heavy compute processing) 를 포함하며, 5129 개의 FP16/32 단위가 있습니다. 설계는 125 MHz 에서 FPGA 에 매핑되었고, TSMC 16FF 에서 5.7 mm^2 를 소비합니다 (8 attention pipes). 우리는 이러한 결과를 가능하게 한 주요 새로운 특성을 검토합니다. 마지막으로, Design Conductor 의 토큰 사용량과 다른 경험적 특성 (empirical characteristics), รวมถึง 그 한계점을 분석합니다.

AI 자동 생성 콘텐츠

원문 바로가기

Design Conductor 2.0: 에이전트가 80 시간 만에 TurboQuant 추론 가속기를 구축합니다

요약

핵심 포인트

댓글