arXiv논문2026. 04. 30. 13:15

신경망 및 구조적 방법을 활용한 명령형 프로그램의 그래프 구성 및 매칭

요약

본 논문은 프로그램과 그 명세 간의 구조적 및 의미론적 유사성을 식별하여 검증 아티팩트 재사용을 가능하게 하는 그래프 구성 파이프라인을 제시합니다. 이 파이프라인은 C/ACSL, Java/JML, C#/Dafny 등 다양한 언어와 주석 스타일의 명령형 프로그램을 유형화된 속성 그래프로 변환합니다. 구조적 관계(AST)와 의미 임베딩(SentenceTransformer, CodeBERT)을 통합하여 포괄적인 그래프 표현을 생성하며, 이는 향후 근사 그래프 매칭 및 의미론적 풍부화 작업의 기반이 됩니다.

핵심 포인트

검증 아티팩트 재사용을 위해 프로그램과 명세 간의 구조적/의미론적 유사성 식별이 필요하다.
제안된 파이프라인은 명령형 프로그램을 유형화된 속성 그래프로 변환하는 과정을 다룬다.
구조적 정보(AST)와 의미 임베딩(CodeBERT, SentenceTransformer)을 결합하여 풍부한 그래프 표현을 생성한다.
본 연구 결과는 다양한 언어 및 주석 스타일에서 일관된 그래프 구축이 가능함을 입증했다.

검증 아티팩트를 재사용하려면 프로그램과 그 명세 간의 구조적·의미론적 유사성을 식별해야 합니다. 본 논문에서는 이 목표를 달성하기 위한 기초 단계로 그래프 구성에 초점을 맞춥니다. 우리는 명령형 프로그램과 그 주석을 유형화된 속성 그래프 (typed, attributed graphs) 로 변환하는 파이프라인을 제시합니다. 우리의 실험은 C 언어와 ACSL, Java 와 JML, 그리고 C# 과 Dafny 를 포함한 데이터셋을 다룹니다. 이 파이프라인은 구문 분석 (AST parsing) 과 SentenceTransformer 및 CodeBERT 와 같은 모델에서 도출된 의미 임베딩 (semantic embeddings) 을 통합합니다. 이를 통해 구조적 관계와 의미론적 맥락을 모두 포착하는 그래프 표현을 생성할 수 있습니다. 우리의 결과는 일관된 그래프 표현이 다양한 언어와 주석 스타일을 걸쳐 구축될 수 있음을 보여줍니다. 이 작업은 확장 가능한 검증 아티팩트 재사용을 위한 향후 단계인 의미론적 풍부화 (semantic enrichment) 와 근사 그래프 매칭 (approximate graph matching) 에 대한 실용적인 기초를 제공합니다.

AI 자동 생성 콘텐츠

원문 바로가기

신경망 및 구조적 방법을 활용한 명령형 프로그램의 그래프 구성 및 매칭

요약

핵심 포인트

댓글