arXiv논문2026. 06. 23. 13:19

SysML v2에서의 자동화된 의미론적 결함 국지화: 지식 그래프로 증강된 LLM을 사용하는 Human-in-the-Loop 프레임워크

요약

SysML v2 모델의 의미론적 오류를 자동으로 식별하고 수정하기 위한 Human-in-the-loop 프레임워크를 제안합니다. 지식 그래프로 증강된 소형 언어 모델(SLM)을 활용하여 설계 결함을 국지화하고 유효한 수정 패치를 생성합니다.

핵심 포인트

지식 그래프를 활용해 도메인 규칙 기반의 의미론적 오류 탐지
Qwen2.5-Coder 및 DeepSeek-Coder SLM 미세 조정 활용
의미론적 결함 수정 성공률을 3%에서 91% 이상으로 대폭 향상
패치 기반 출력을 통해 토큰 길이를 60% 이상 단축

SysML v2의 텍스트 구문은 모델 구조와 언어 준수 여부에 대한 컴파일러 기반 검증을 가능하게 합니다. 그러나 구문론적 유효성은 유지하지만 도메인 규칙을 위반하는 의미론적(semantic) 오류는 컴파일러를 통해 탐지할 수 없습니다. 이러한 오류는 설계 프로세스를 통해 전파되어 설계 후반부에 비용이 많이 드는 통합 실패로 나타날 수 있습니다. 본 논문은 이러한 오류를 자동으로 식별하고 수정하기 위한 Human-in-the-loop (인간 참여형) 프레임워크를 제시합니다. 이 프레임워크는 미세 조정된 소형 언어 모델 (SLM)과 시스템 요소 간의 물리적 호환성 규칙을 인코딩하는 도메인 지식 그래프 (knowledge graph)를 결합합니다. 지식 그래프는 또한 그럴듯한 도메인 위반 사항을 체계적으로 도입함으로써 합성 학습 데이터의 생성을 가이드하며, 추론 시점에 모델을 증강하여 수정 제안이 유효한 엔지니어링 제약 조건에 근거하도록 합니다. 우리는 기계, 전기, 유체 및 신호 인터페이스 간의 관계를 지식 그래프가 캡처하는 차량 시스템 도메인을 사용하여 이 프레임워크를 입증합니다. Qwen2.5-Coder-1.5B 및 DeepSeek-Coder-6.7B라는 두 개의 SLM을 미세 조정하여, 결함을 국지화하고 엔지니어의 검토를 위한 후보 수정을 제시하는 통합 diff 패치를 출력하도록 함으로써 설계 프로세스에서 인간의 판단을 보존합니다. 1,184개의 테스트 샘플을 평가한 결과, 미세 조정은 의미론적 결함 수정을 3% 미만에서 91% 이상으로 향상시켰으며, 패치 기반 출력은 토큰 길이를 60% 이상 단축했습니다. 이 프레임워크는 기존 MBSE 도구를 보완하는 AI 지원 모델 검증을 향한 실질적인 경로를 제공합니다.

AI 자동 생성 콘텐츠

원문 바로가기

SysML v2에서의 자동화된 의미론적 결함 국지화: 지식 그래프로 증강된 LLM을 사용하는 Human-in-the-Loop 프레임워크

요약

핵심 포인트

댓글