arXiv논문2026. 06. 08. 12:13

정량적 가독성 지표를 활용한 LLM 에이전트 기반 역공학 지원

요약

본 논문은 LLM 에이전트를 활용하여 디컴파일된 C 코드의 가독성을 개선하는 연구를 다룹니다. 정량적 가독성 점수(QRS) 프레임워크를 제안하여, 코드의 구조적 유사성을 유지하면서도 어휘적·구조적·관용적 품질을 높이는 방법을 제시합니다.

핵심 포인트

LLM 에이전트 기반의 역공학 가독성 개선 방법론 제안
구조적 유사성과 가독성을 동시에 고려한 QRS 프레임워크 개발
어휘적 놀라움, 구조적 단순성, 관용적 품질 지표 활용
코드의 기능적 정확성을 유지하며 가독성을 높이는 정제 과정 입증

자동 디컴파일러(Automatic decompilers)는 기능적으로는 정확하지만 읽기 어려운 C 코드를 생성하는 경우가 많습니다. 본 논문은 역공학(Reverse engineering) 워크플로의 한 단계, 즉 정량적 지표(Quantitative metrics)의 안내를 받는 LLM 에이전트(LLM agents)를 사용하여 디컴파일된 코드의 가독성을 개선하는 문제를 다룹니다. 우리는 세 단계의 연구 진화 과정을 제시합니다. 1단계(Ghidra MCP를 통한 도구 주도형 스티어링)는 정량적 가이드의 부재로 인해 불완전한 커버리지와 일관되지 않은 개선 사항이라는 문제를 겪었습니다. 2단계(구조적 유사성 검증만 수행)에서는 에이전트가 의도하지 않은 방식으로 지표를 최적화하여, 구조적으로는 동일하지만 가독성은 더 낮은 코드를 생성한다는 점이 밝혀졌습니다. 우리의 기여는 정량적 가독성 점수(Quantitative Readability Score, QRS) 프레임워크로, 이는 구조적 유사성 게이트(Structural similarity gate)와 세 가지 독립적인 가독성 하위 지표(어휘적 놀라움(Lexical Surprisal), 구조적 단순성(Structural Simplicity), 관용적 품질(Idiomatic Quality))를 결합한 복합 지표입니다. 우리는 QRS 가이드 기반의 정제(Refinement)를 통해 LLM 에이전트가 정확성을 희생하지 않으면서도 목표로 하는 가독성 개선을 수행할 수 있음을 입증합니다. 맥락으로서 더 넓은 역공학 워크플로(바이너리 리프팅(Binary lifting), 디컴파일 클린업(Decompilation cleanup), 기능적 동등성 달성)에 대한 논의를 제공하지만, 이는 본 연구의 범위를 벗어납니다.

AI 자동 생성 콘텐츠

원문 바로가기

정량적 가독성 지표를 활용한 LLM 에이전트 기반 역공학 지원

요약

핵심 포인트

댓글