범위는 줄었으나 위협은 여전하다: 2026년 프론티어 모델 코호트를 통한 LLM 패키지 환각 (Hallucination) 재평가

Spracklen 등(USENIX Security '25)은 코드 생성 대규모 언어 모델 (LLM)이 PyPI 또는 npm에 존재하지 않는 패키지 이름을 환각 (Hallucination)하는 현상을 보여주었습니다. 그 비율은 상용 모델의 경우 5.2%에서 오픈 소스 모델의 경우 21.7%에 달하며, 이는 환각된 이름으로 악성 패키지를 등록하는 슬롭스쿼팅 (slopsquatting) 공격 표면을 생성합니다. 우리는 2025년 10월부터 2026년 3월 사이에 출시된 5개의 프론티어 코드 가능 LLM인 Claude Sonnet 4.6, Claude Haiku 4.5, GPT-5.4-mini, Gemini 2.5 Pro, DeepSeek V3.2를 대상으로 그들의 방법론을 재현했습니다. PyPI 및 npm 마스터 리스트를 통해 검증된 199,845개의 Python 및 JavaScript 쌍 프롬프트 전반에 걸쳐, 우리는 전체 환각률이 4.62% (Claude Haiku 4.5)에서 6.10% (GPT-5.4-mini) 사이임을 측정했습니다. 이는 Spracklen이 관찰했던 모델 간 편차를 한 자릿수 수준으로 압축한 것이지만, 위협이 사라진 것은 아닙니다. 재현을 넘어, 우리는 평가된 5개 모델 모두가 동일하게 만들어내는 127개의 패키지 이름 세트(PyPI 109개, npm 18개)를 식별하였으며, 이는 단일 모델 연구로는 밝혀낼 수 없는 모델 불가지론적 (model-agnostic) 공급망 공격 표면을 구성합니다. 나아가 우리는 Spracklen의 2024년 연구 결과를 뒤집는 Python-over-JavaScript 환각 비대칭성을 기록하였고, Anthropic 제품군 내에서 Haiku-below-Sonnet 역전 현상을 식별하였으며, DeepSeek V3.2와 GPT-5.4-mini 사이의 Jaccard 유사도 정점 (J = 0.343)을 관찰하여 공유된 학습 데이터 기원을 시사하는 결과를 도출했습니다.

Insights

범위는 줄었으나 위협은 여전하다: 2026년 프론티어 모델 코호트를 통한 LLM 패키지 환각 (Hallucination) 재평가

요약

핵심 포인트

댓글

ELSA3D: 통합 3D 이해 및 생성을 위한 탄성 의미 앵커링

$META, 이미지 생성용 AI 모델 출시 및 자체 모델로 제3자 AI 이미지 모델 대체 계획

Figma Code Layers, MCP Server, Motion 및 생성형 셰이더와 플러그인 출시 이후 프롬프팅의 역할에 대해 생각하며

요약: Base MCP의 작동 방식

ELSA3D: 통합 3D 이해 및 생성을 위한 탄성 의미 앵커링

$META, 이미지 생성용 AI 모델 출시 및 자체 모델로 제3자 AI 이미지 모델 대체 계획

Figma Code Layers, MCP Server, Motion 및 생성형 셰이더와 플러그인 출시 이후 프롬프팅의 역할에 대해 생각하며

요약: Base MCP의 작동 방식