arXiv논문2026. 06. 30. 10:25

실제 취약점 탐지를 위한 바이너리 코드 유사성 이해: 대규모 실증 연구

요약

펌웨어 내 제3자 라이브러리(TPL)의 취약점을 탐지하기 위한 바이너리 코드 유사성 탐지(BCSD)의 대규모 실증 연구를 다룹니다. 함수 버전, 탐색 공간, 함수 크기, 컴파일 툴체인이 성능에 미치는 영향을 분석하고 성능을 개선하는 전략을 제안합니다.

핵심 포인트

60,000개 펌웨어 이미지를 활용한 대규모 BCSD 성능 분석 수행
함수 버전 및 컴파일 툴체인이 유사성 탐지 성능에 큰 영향을 미침을 확인
빌드 인식 쿼리 전략을 통해 MRR을 0.818에서 0.981로 향상
TPL 인식 2단계 탐색 프로세스로 정확도를 18.5% 개선

펌웨어(Firmware)는 IoT 기기의 핵심에 위치합니다. 펌웨어의 개발은 제3자 라이브러리(Third-Party Libraries, TPLs)에 크게 의존하며, 이는 개발 프로세스를 크게 가속화하지만 동시에 관련 취약점(Vulnerabilities)을 유발합니다. 바이너리 코드 유사성 탐지(Binary Code Similarity Detection, BCSD)는 코드 세그먼트 쌍을 비교함으로써 펌웨어 내의 취약점을 식별하는 효과적인 기술입니다. 그러나 기존 연구들은 소규모 데이터셋에서만 성능을 평가하거나, 취약점, TPL, 펌웨어 측면에서의 다양성이 부족합니다. 결과적으로, 실제 취약점 탐지를 위한 BCSD에 대한 포괄적인 이해가 결여되어 있습니다. 이러한 격차를 해소하기 위해, 본 연구에서는 BCSD를 사용하여 200개 업체의 60,000개 펌웨어 이미지에 걸친 취약점 탐지에 대한 대규모 연구를 수행합니다. 새로운 모델을 도입하기보다는, 취약한 함수 버전(Vulnerable function versions), 취약점 탐색 공간(Vulnerability search space), 함수 크기(Function sizes), 그리고 컴파일 툴체인(Compilation toolchains)이라는 네 가지 핵심 요소가 BCSD 성능에 미치는 영향을 조사합니다. 연구 결과, 이러한 요소들이 성능에 상당한 영향을 미치며, 종종 큰 차이를 만든다는 것을 발견했습니다. 이를 해결하기 위해, 우리는 대표적인 실제 바이너리로부터 쿼리(Query)를 도출하는 빌드 인식 쿼리 전략(Build-aware query strategy)을 제안하며, 이를 통해 격차를 효과적으로 좁히고 평균 재순위(Mean Reciprocal Rank, MRR)를 0.818에서 0.981로 높였습니다. 나아가, 우리는 TPL 인식 2단계 탐색 프로세스(TPL-aware, two-stage search process)가 탐색 공간을 제한함으로써 정확도를 크게 향상시켜 MRR을 18.5% 개선함을 입증합니다.

AI 자동 생성 콘텐츠

원문 바로가기

실제 취약점 탐지를 위한 바이너리 코드 유사성 이해: 대규모 실증 연구

요약

핵심 포인트

댓글