arXiv논문2026. 05. 20. 10:59

CAD 생성을 위한 메모리 증강 강화학습 (Reinforcement Learning) 에이전트

요약

기존 LLM 기반 CAD 생성 방식의 추론 단절과 오류 수정 한계를 극복하기 위해 메모리 증강 강화학습(Reinforcement Learning) 프레임워크를 제안합니다. 이 시스템은 기하학적 커널을 도구 체인으로 활용하며, 이중 트랙 메모리 모듈을 통해 설계 의도 이해부터 검증까지의 폐쇄 루프 메커니즘을 구축합니다. 강화학습을 통해 검색 함정을 피하고 추가 데이터 없이도 온라인 자기 수정이 가능하여 복잡한 모델 생성의 성공률과 일관성을 높였습니다.

핵심 포인트

기하학적 커널을 구조화된 도구 체인으로 캡슐화하여 설계 의도와 실행을 연결
사례 라이브러리와 기술 라이브러리로 구성된 이중 트랙 메모리 모듈 도입
강화학습을 통한 동적 유틸리티 검색으로 기하학적 오류(retrieval traps) 방지
대규모 주석 데이터 없이도 온라인 자기 수정 및 지속적인 모델 진화 가능
복잡한 CAD 모델 생성 시 성공률 및 기하학적 일관성 향상

컴퓨터 보조 설계 (CAD) 모델의 자동 생성은 첨단 제조의 지능화를 가능하게 하는 핵심 기술입니다. 대규모 언어 모델 (LLMs)에 기반한 기존 생성 방식은 긴 작업 시퀀스, 다양한 작업 유형, 강력한 기하학적 제약 조건을 특징으로 하는 복잡한 CAD 모델을 처리할 때, 주로 추론 체인 (reasoning chains)이 끊어지고 효과적인 오류 수정 메커니즘이 부족하다는 이유로 한계를 보이는 경우가 많습니다. 이 문제를 해결하기 위해, 본 논문은 CAD 생성을 위한 메모리 증강 강화학습 (Reinforcement Learning) 프레임워크를 제안합니다. 이 프레임워크는 기저의 기하학적 커널 (geometric kernel)을 에이전트가 호출할 수 있는 구조화된 도구 체인 (toolchain)으로 캡슐화하며, 설계 의도 이해, 전역 계획 (global planning), 실행 및 다차원 검증의 폐쇄 루프 (closed-loop) 메커니즘을 구축합니다. 또한 사례 라이브러리 (case library)와 기술 라이브러리 (skill library)로 구성된 이중 트랙 메모리 모듈을 설계하고, 동적 유틸리티 검색 알고리즘을 제안합니다. 검색 및 정책 최적화 (policy optimization)에 강화학습 (Reinforcement Learning)을 도입함으로써, 에이전트는 예시가 의미론적으로는 유사하지만 기하학적으로는 실행 불가능한 검색 함정 (retrieval traps)을 효과적으로 피할 수 있으며, 추가적인 대규모 주석 데이터 (annotated data) 없이도 온라인 자기 수정 및 지속적인 진화가 가능합니다. 실험 결과, 제안된 방법은 복잡한 CAD 모델 생성 작업에서 성공률과 기하학적 일관성 (geometric consistency)을 모두 크게 향상시키는 것으로 나타났습니다.

AI 자동 생성 콘텐츠

원문 바로가기

CAD 생성을 위한 메모리 증강 강화학습 (Reinforcement Learning) 에이전트

요약

핵심 포인트

댓글