arXiv논문2026. 06. 08. 12:12

거인의 어깨 위에서: GiAnt Corpus를 통한 자동화된 스마트 컨트랙트 감사 역량 강화

요약

GiANT는 실제 감사 보고서에서 취약점 정보를 자동으로 추출하는 프레임워크로, CoT와 분할 정복 전략을 사용합니다. 이를 통해 생성된 GiAnt Corpus는 높은 신뢰성을 바탕으로 스마트 컨트랙트 보안 연구를 위한 벤치마크를 제공합니다.

핵심 포인트

GiANT 프레임워크를 통한 자동화된 데이터셋 큐레이션
CoT 및 LLM-as-a-judge를 활용한 고품질 데이터 추출
7,711개의 취약점 발견 사항을 포함한 GiAnt Corpus 구축
취약점 탐지 및 코드 요약 등 다양한 작업의 성능 기준점 수립

고품질의 스마트 컨트랙트 감사 (Smart Contract Auditing) 데이터셋은 보안 도구를 평가하고 스마트 컨트랙트 보안 연구를 발전시키는 데 매우 중요합니다. 기존 데이터셋의 두 가지 주요 한계점은 수동 작업으로 인한 확장성 병목 현상과 데이터의 세밀도 (Granularity) 및 다양성 부족입니다. 이러한 한계를 해결하기 위해, 우리는 실제 감사 보고서로부터 취약점 통찰력을 추출하여 스마트 컨트랙트 감사 데이터셋을 큐레이션하도록 설계된 자동화 프레임워크인 GiANT를 제안합니다. GiANT는 Code4rena 보고서에서 구조화된 취약점 정보를 추출하기 위해 Chain-of-Thought (CoT) 기법과 결합된 분할 정복 (Divide-and-conquer) 전략을 채택하며, 이후 엄격한 품질 보증 (Quality Assurance)을 수행하기 위해 LLM-as-a-judge 메커니즘을 사용합니다. GiANT의 효과를 평가하기 위해, 우리는 388개의 실제 감사 보고서에 이를 실행하여 5가지 심각도 수준에 걸쳐 7,711개의 취약점 발견 사항을 포함하는 GiAnt Corpus를 생성했습니다. 데이터셋에 대한 수동 평가 결과, 정보 추출에 있어 탁월한 신뢰성을 입증하였으며, 평가자 간 일치도 $κ$가 0.88, 평균 품질 점수는 5점 만점에 $4.76 ext{±}0.37$을 달성했습니다. 우리는 더 나아가 취약점 탐지 (Vulnerability Detection), 코드 요약 (Code Summarization), 완화 권고 (Mitigation Recommendation), 그리고 자동 가스 최적화 (Automated Gas Optimization) 작업에 대해 4개의 최첨단 (State-of-the-art) LLM을 벤치마킹함으로써 데이터셋의 실용성을 검증하고 성능 기준점 (Baseline)을 수립하였으며, 이를 통해 향후 자동화된 스마트 컨트랙트 감사 연구를 위한 가치 있는 데이터 기반을 제공합니다.

AI 자동 생성 콘텐츠

원문 바로가기

거인의 어깨 위에서: GiAnt Corpus를 통한 자동화된 스마트 컨트랙트 감사 역량 강화

요약

핵심 포인트

댓글