arXiv논문2026. 06. 23. 12:11

코드 스타일로메트리(Code Stylometry)를 은폐하기 위한 대규모 언어 모델(LLM)의 활용: GPT-3.5와 GPT-4의 비교 연구

요약

GPT-3.5와 GPT-4를 활용하여 프로그래머의 고유한 코드 스타일을 은폐하는 연구를 다룹니다. 프롬프트 엔지니어링 전략에 따른 스타일 은폐 효과와 코드 무결성 유지의 어려움을 분석했습니다.

핵심 포인트

LLM을 이용한 코드 스타일로메트리 은폐 가능성 확인
싱글샷 대비 멀티샷 프롬프트의 높은 효과성 입증
스타일 변경 시 코드의 기능적 무결성 유지의 난제 제시
AI 기반 저자 식별 기술에 대한 보안 위협 분석

급변하는 소프트웨어 개발 분야에서 프로그래머의 고유한 스타일적 특징을 분석하는 코드 스타일로메트리(Code Stylometry)는 저자 식별(Authorship Attribution) 및 사이버 보안에서 중요한 역할을 합니다. 최근 인공지능의 발전, 특히 GPT-3.5 및 GPT-4와 같은 대규모 언어 모델(LLMs)은 이 분야에 새로운 차원을 도입하며 전통적인 스타일로메트리 기술에 도전하고 있습니다. 본 연구는 기능성을 유지하면서 코드 스타일로메트리를 변경하는 데 있어 LLM의 효과를 조사하고, 다양한 프롬프트 엔지니어링(Prompt Engineering) 전략의 영향을 평가합니다. 포괄적인 실험을 통해, 우리는 이러한 모델들이 저자 식별을 위해 학습된 랜덤 포레스트(Random Forest) 분류기의 탐지를 피하기 위해 스타일적 특징을 얼마나 잘 은폐할 수 있는지 평가합니다. 결과에 따르면, 싱글샷(Single-shot) 방식과 멀티샷(Multi-shot) 방식 간의 효과성에 상당한 차이가 있음이 드러났으며, 상세하고 구조화된 프롬프트의 중요성이 강조되었습니다. 또한, 기능성 유지 점검을 통해 코드 수정 후 코드의 무결성(Integrity)을 유지하는 데 따르는 어려움을 입증했습니다. 본 연구는 고급 AI 능력에 맞선 저자 식별 기술의 견고성에 대한 중요한 통찰을 제공하며, 향후 사이버 보안 및 소프트웨어 공학 발전에 정보를 제공합니다.

AI 자동 생성 콘텐츠

원문 바로가기

코드 스타일로메트리(Code Stylometry)를 은폐하기 위한 대규모 언어 모델(LLM)의 활용: GPT-3.5와 GPT-4의 비교 연구

요약

핵심 포인트

댓글