타이틀드 프롬프트, 타게트드 프로텍션: 스마트 컨트랙트 취약점 분석을 위한 LLM 기반 접근법
요약
본 논문은 블록체인 스마트 컨트랙트의 보안 취약점을 탐지하기 위한 LLM 기반 프레임워크를 제안합니다. 기존 방식의 한계를 극복하기 위해, 15개 플랫폼에서 수집된 대규모 주석화 데이터셋을 활용하고 AST(Abstract Syntax Tree) 기반 컨텍스트 추출과 특화된 프롬프트 디자인을 결합했습니다. 이 접근법은 다양한 취약점 카테도리별 맞춤형 탐지기를 구현하여, 높은 평균 양의/음의 재현율(recall)을 달성하며 스마트 컨트랙트 보안 분석에 새로운 가능성을 제시합니다.
핵심 포인트
- 스마트 컨트랙트는 불변성으로 인해 심각한 보안 취약점에 노출되어 있어 전문적인 분석이 필수적입니다.
- 제안된 LLM 기반 프레임워크는 AST 기반의 정확한 컨텍스트 추출과 특화된 프롬프트 디자인을 결합하여 효율성을 높였습니다.
- 15개 블록체인 플랫폼에서 수집된 3만 개 이상의 대규모 주석화 취약점 데이터셋을 구축하고 공개했습니다.
- 실험 결과, 평균 양의 재현율(0.92)과 음의 재현율(0.85)을 달성하며 고정밀 보안 분석 능력을 입증했습니다.
블록체인 상의 스마트 컨트랙트는 불변성 (immutable nature) 의 특성으로 인해 다양한 보안 취약점에 노출되어 있으며, 이로 인한 금융적 손실이 발생할 수 있습니다. 기존 탐지 접근법은 취약점 유형에 따른 유연성이 부족하고, 전문 규칙을 수동으로 작성하는 데 과도하게 의존합니다. 본 논문에서는 실용적인 스마트 컨트랙트 취약점 탐지를 위한 LLM 기반 프레임워크를 제시합니다. 우리는 15 개 주요 블록체인 플랫폼의 3,200 개 이상의 실제 프로젝트에서 수집한 31,165 개의 전문적으로 주석 처리된 취약점 인스턴스를 포함하는 대규모 데이터셋을 구축하고 공개했습니다. 우리의 접근법은 정확한 AST 기반 컨텍스트 추출과 취약점 특화 프롬프트 디자인을 활용하여 13 가지 주요 취약점 카테고리별 맞춤형 탐지기를 구현합니다. 실험 결과는 평균 양의召回 (positive recall) 0.92 와 평균 음의召回 (negative recall) 0.85 를 달성함으로써, 정교하게 설계된 컨텍스트 프롬프팅이 확장 가능하고 고정밀 스마트 컨트랙트 보안 분석에 잠재력을 보여줍니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기