EdgeFlow: 산업 요구사항 공학을 위한 Edge-Map 증강 VLM 기반 순서도 처리 기술
요약
EdgeFlow는 VLM이 순서도의 위상 구조를 놓치는 문제를 해결하기 위해 Canny edge map을 입력에 증강하는 기술을 제안합니다. 별도의 미세 조정 없이도 순서도를 Mermaid 형식으로 변환하는 성능을 크게 향상시켰습니다.
핵심 포인트
- Canny edge map 증강을 통한 구조적 사전 정보 제공
- 학습이 필요 없는(training-free) 방식의 성능 개선
- 노드 및 엣지 수준 F1 점수 약 17% 향상
- 산업용 요구사항 공학을 위한 실용적 변환 도구 제안
순서도(Flowcharts)는 산업 요구사항(industrial requirements) 분야에서 널리 사용되지만, 대개 정적 이미지로 포함된 상태로 남아 있습니다. 시각 언어 모델(Vision Language Models, VLMs)은 이러한 순서도를 요구사항 공학(Requirements Engineering, RE) 활동을 위한 기계 판독 가능 모델로 변환하는 데 유망한 가능성을 보여주지만, 순서도 변환에 직접 적용될 경우 위상(topology) 측면에서 중요한 시각적 세부 사항을 놓치는 경우가 많습니다. 이를 해결하기 위해, 우리는 주석이 달린 학습 데이터나 도메인 특화 모델의 미세 조정(fine-tuning) 없이도 순서도를 Mermaid 형식으로 변환하는 성능을 향상시키기 위해, 구조적 사전 정보(structural prior) 역할을 하는 결정론적으로 추출된 Canny edge map을 VLM의 원래 입력에 증강하는 EdgeFlow를 제안합니다. 우리는 실제 요구사항에서 추출한 데이터셋인 IndusReqFlow를 통해 EdgeFlow를 평가합니다. 기존의 상용(off-the-shelf) VLMs와 비교했을 때, EdgeFlow는 노드 수준(node-level) F1 점수를 17.39%포인트, 엣지 수준(edge-level) F1 점수를 16.94%포인트 향상시켰습니다. 경로 수준(path level)에서 EdgeFlow는 경로 F1 점수를 11.06%포인트 향상시켜 모델 기반 테스트(model-based testing)를 더 잘 지원할 수 있게 합니다. 이러한 결과는 EdgeFlow가 산업용 RE를 위해 위상을 보존하는 순서도-to-Mermaid 변환을 개선할 수 있는 실용적이고 학습이 필요 없는(training-free) 수단을 제공함을 입증합니다. 공개된 합성 벤치마크(synthetic benchmark)에 대한 교차 데이터셋(cross-dataset) 평가 결과에서는 유의미한 개선이 나타나지 않았으며, 이는 향후 VLM 기반 RE 도구의 종합적인 평가를 위해 산업 데이터를 포함하는 다양한 벤치마크가 필요함을 강조합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv Codex (cs.SE)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기