arXiv논문2026. 06. 17. 10:52

대규모 자동차 소프트웨어 요구사항을 위한 클러스터 인지형 이중 레벨 테스트 명세 생성

요약

대규모 자동차 소프트웨어 요구사항을 처리하기 위해 '클러스터 후 요약(Cluster-then-Summarize)' 파이프라인을 제안하는 연구입니다. UMAP과 HDBSCAN을 활용해 요구사항을 그룹화하고, 멀티 레벨 맵리듀스 방식으로 테스트 명세를 생성하여 컨텍스트 제한 문제를 해결합니다.

핵심 포인트

LLM의 컨텍스트 창 제한 및 요구사항 간 의존성 문제를 해결하는 새로운 파이프라인 제시
UMAP과 HDBSCAN을 이용한 요구사항 클러스터링 및 자동 최소 클러스터 크기 선택
개별 요구사항 검증과 클러스터 레벨 통합 테스트를 아우르는 이중 레벨 명세 생성
RAG를 통해 ISO 26262 및 ASPICE 표준 준수 및 요약 충실도 확보

Automotive SPICE SWE.6 요구사항을 충족하는 테스트 명세(test specifications)를 생성하는 것은 프로젝트 규모가 수천 개의 요구사항으로 확장됨에 따라 점점 더 어렵고 시간이 많이 소요되는 작업이 되고 있습니다. 이러한 수동 프로세스는 종종 수 주간의 엔지니어링 노력을 소모하기 때문에 자동화가 필수적인 요소가 되었습니다. 그러나 표준적인 대규모 언어 모델 (Large Language Model (LLM)) 접근 방식은 대규모 환경에서 어려움을 겪습니다. 요구사항을 개별적으로 처리하면 필수적인 요구사항 간의 의존성을 놓치게 되며, 전체 코퍼스(corpora)를 한꺼번에 입력하면 컨텍스트 창(context-window) 제한을 초과하여 불완전한 통합 커버리지와 중복된 테스트 케이스를 초래합니다. 본 논문은 3단계 과정을 통해 이러한 한계를 해결하는 새로운 "클러스터 후 요약 (Cluster-then-Summarize)" 파이프라인을 제시합니다. 요구사항은 문장 트랜스포머(sentence transformers)를 사용하여 임베딩되며, UMAP 차원 축소(dimensionality reduction)와 HDBSCAN 밀도 기반 클러스터링(density-based clustering)을 통해 그룹화됩니다. 이 그룹화 과정은 정규화된 실루엣 계수(Silhouette score)와 칼린스키-하라바즈 점수(Calinski-Harabasz score)를 결합한 품질 기준에 의해 구동되는 자동 최소 클러스터 크기 선택 방식을 활용합니다. 이후 멀티 레벨 맵리듀스(multi-level map-reduce) 요약 알고리즘이 각 클러스터를 정량적 임계값과 안전 무결성 수준(safety integrity levels)을 보존하면서 간결하고 도메인에 부합하는 설명으로 추출합니다. 이 파이프라인은 도출된 클러스터 토폴로지(topology)를 활용하여 두 가지 레벨에서 테스트 명세를 생성합니다: 개별 요구사항 검증 및 요구사항 간 기능 동작을 검증하는 클러스터 레벨 통합 테스트입니다. 인접 클러스터 컨텍스트(nearby-cluster context) 메커니즘은 각 LLM 호출 중에 제한된 범위 내의 교차 기능 인지(cross-feature awareness)를 제공하며, 검색 증강 생성 (Retrieval-Augmented Generation (RAG))은 모든 출력을 ISO 26262 및 ASPICE 표준에 근거하도록 합니다. 다양한 규모의 자동차 요구사항 데이터셋에 대한 평가 결과, 클러스터 인지형 접근 방식은 베이스라인 방법들과 비교하여 통합 테스트 커버리지를 개선하고 요약 충실도(summarization fidelity)를 유지하면서도 수천 개의 요구사항까지 효율적으로 확장할 수 있음을 입증했습니다.

AI 자동 생성 콘텐츠

원문 바로가기

대규모 자동차 소프트웨어 요구사항을 위한 클러스터 인지형 이중 레벨 테스트 명세 생성

요약

핵심 포인트

댓글