모델 편집(Model Editing)을 통한 대규모 언어 모델(LLM)의 패키지 환각(Package Hallucination) 완화
요약
LLM이 존재하지 않는 패키지 이름을 생성하는 '패키지 환각' 문제를 해결하기 위한 경량 모델 편집 프레임워크 BOUND를 제안합니다. BOUND는 LoRA 어댑터를 사용하여 유효한 패키지 경계를 정교화함으로써 소프트웨어 공급망 공격 위험을 낮추고 코드 생성의 신뢰성을 높입니다.
핵심 포인트
- 패키지 환각으로 인한 소프트웨어 공급망 공격 위험성 지적
- 경량화된 국소적 모델 편집 프레임워크 BOUND 소개
- 위험 인식 국소화 및 경계 인식 목적 함수 활용
- 패키지 수준 환각률(Package-HR)을 최대 79.9% 감소
- 코드 생성 및 pip install 추천 등 다양한 작업으로 일반화 가능
대규모 언어 모델(LLMs)은 코드 생성, 라이브러리 추천, 의존성 설정(dependency configuration)과 같은 소프트웨어 공학 작업에서 강력한 능력을 입증해 왔습니다. 그러나 최근 연구에 따르면 LLM은 존재하지 않거나 유효하지 않은 패키지 이름을 생성하는 패키지 환각(package hallucination) 문제를 겪을 수 있습니다. 이러한 환각은 공격자가 환각된 이름으로 악성 패키지를 등록할 수 있기 때문에 소프트웨어 공급망 공격(software supply chain attacks)에 악용될 수 있습니다. 따라서 패키지 환각을 완화하는 것은 LLM 지원 소프트웨어 개발의 신뢰성과 보안을 향상시키는 데 중요합니다. 본 논문에서는 LLM의 패키지 환각을 완화하기 위한 경량화된 국소적 모델 편집(localized model editing) 프레임워크인 BOUND를 소개합니다. BOUND는 패키지 환각 완화를 패키지 유효성 경계 편집(package-validity boundary editing) 문제로 정의하며, 여기서 경계(boundary)란 주어진 작업 컨텍스트 하에서 유효한 패키지와 환각된 패키지 이름을 구별하는 모델의 능력을 의미합니다. BOUND는 먼저 위험 인식 국소화(risk-aware localization) 전략을 통해 패키지 환각과 관련된 모듈을 찾아낸 다음, 유효한 패키지를 강화하고, 환각된 패키지를 억제하며, 국소성(locality) 동작을 보존하는 경계 인식 목적 함수(boundary-aware objective)를 사용하여 경량 LoRA 어댑터(LoRA adapters)로 이러한 모듈을 편집합니다. 실험 결과, BOUND는 유효한 패키지 추천을 유지하면서 패키지 환각을 효과적으로 줄이는 것으로 나타났습니다. 패키지 추천 작업에서 BOUND는 편집 프롬프트(edit prompts)에서 패키지 수준 환각률(Package-HR)을 79.9% 감소시켰으며, 미학습 프롬프트(unseen prompts)에서는 65.4% 감소시켰습니다. 학습된 패키지 유효성 경계는 다른 패키지 관련 작업으로도 일반화되어, 코드 생성(code generation)에서 Package-HR을 12.8% 감소시켰고, pip install 추천에서 34.0% 감소시켰습니다. 이러한 결과는 BOUND가 LLM의 패키지 유효성 경계를 정교화하고 패키지 관련 출력의 신뢰성을 향상시킨다는 것을 보여줍니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv Codex (cs.SE)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기