브라질 정부의 LLM, 제3자 모델의 무단 병합임이 드러나다
요약
브라질 정부가 자체 개발했다고 주장한 397B 언어 모델이 사실은 Nex-N2_pro와 Qwen3.5 모델을 무단 병합한 결과물임이 밝혀졌습니다. 연구진은 정체성 조사와 텐서 통계 분석을 통해 모델의 가중치 병합 사실을 입증했습니다.
핵심 포인트
- 브라질 정부의 LLM이 제3자 모델의 무단 병합임을 입증
- 정체성 조사 및 텐서 수준 통계 분석을 통한 증거 확보
- AI 모델 도난 및 공급망 무결성 위반 문제 제기
- 정부의 AI 조달 및 지식재산권 귀속 신뢰도 타격
포렌식 요약 (Forensic Summary)
연구원들은 리우데자네이루(Rio de Janeiro)가 공개적으로 '자체 개발'했다고 발표한 397B 언어 모델이 독창적인 창작물이 아니라, Nex-N2_pro 모델과 Qwen3.5-397B-A17B 모델을 공개하지 않은 채 요소별 가중치 병합 (element-wise weight merge)한 결과물임을 입증했습니다. 이 발견은 두 가지 독립적인 방법을 통해 확립되었습니다: 모델이 79%의 확률로 자신을 'Nex'라고 식별하는 정체성 조사 (identity probing), 그리고 모든 60개 레이어에 걸쳐 일관된 0.6/0.4 혼합을 확인한 텐서 수준의 통계 분석 (tensor-level statistical analysis)입니다. 이는 모델 도난 및 공급망 무결성 (supply chain integrity) 위반에 해당하며, 정부의 AI 조달 및 지식재산권 (IP) 귀속에 대한 대중의 신뢰에 추가적인 영향을 미칩니다.
Grid the Grey에서 전체 기술 심층 분석을 읽어보세요: https://gridthegrey.com/posts/brazilian-government-llm-exposed-as-unauthorised-merge-of-third-party-models/
AI 자동 생성 콘텐츠
본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기