세계 최고의 AI 모델들이 어떻게 복구되었는가
요약
Anthropic의 최신 모델 Mythos와 Fable의 보안 결함 이슈로 인해 미국 정부의 수출 통제와 모델 오프라인 조치가 내려졌던 사건을 다룹니다. Amazon의 경고로 시작된 이번 사태는 정부 기관과의 협력을 통해 모델의 안전성을 검증받고 복구되는 과정을 보여줍니다.
핵심 포인트
- Amazon의 보안 경고로 Anthropic 모델의 탈옥 위험성 제기
- 미국 정부의 수출 통제 및 모델 오프라인 전환 조치 시행
- 정부 기관(NSA 등)의 검증을 거쳐 모델 안전성 확보 및 재출시
- AI 모델의 보안 이슈가 국가 안보 및 규제와 직결됨을 시사
세계에서 가장 강력한 AI 모델들을 인터넷에서 삭제했던 그 싸움은 성격 차이, 업계의 혼란, 그리고 국제적인 반발을 불러일으켰습니다.
중요한 이유: Anthropic의 모델들이 다시 온라인 상태로 돌아왔지만, 트럼프(Trump) 행정부와 벌인 20일간의 대결이 남긴 영향은 오래 지속될 것입니다.
비하인드 스토리: 사건은 Anthropic의 파트너이자 투자자인 Amazon이 경고를 울리면서 시작되었으나, 이 경고는 나중에 사이버 보안 전문가들에 의해 반박되었습니다.
- Amazon은 해당 AI 연구소의 최신 모델인 Mythos와 Fable에서 발견된 "탈옥 (jailbreaking)" 문제, 즉 가드레일 (guardrails)의 실패를 초래할 수 있는 기술적 결함에 대해 경고했습니다.
- Amazon은 정부에 우려 사항을 알렸고, 이는 광범위한 수출 통제를 촉발했습니다. 한 미국 관리는 해당 문제가 해결되어야 한다는 점이 명확해지자 정부 차원에서 자체 테스트를 실시했다고 밝혔습니다.
- 그러나 사이버 보안 전문가들은 나중에 정부에 보내는 공개 서한을 통해, 다른 선도적인 AI 모델들도 Amazon이 Anthropic에 대해 경고했던 것과 동일한 문제를 가지고 있다고 작성했습니다.
6월 12일, Howard Lutnick 상무장관은 트럼프 대통령의 지시에 따라 Anthropic의 CEO인 Dario Amodei에게 전화를 걸었습니다.
- 미국 관리에 따르면, Lutnick는 Amodei에게 이 문제가 빠르게 해결되어야 함을 분명히 했으며, 회사가 광범위한 수출 통제를 부과하는 서신을 받게 될 것이라고 CEO에게 알렸습니다.
- Amodei는 서신을 받은 그날 밤 Lutnick에게 다시 전화를 걸었고, 이것이 사실상 모델들을 오프라인 상태로 전환해야 함을 의미한다는 것을 깨달았습니다. 이에 대해 Lutnick는 그것이 실제로 목표라고 답했습니다.
이 결정은 3주간 여러 기관이 참여하는 AI 안전 (AI safety) 속성 과정으로 이어졌습니다.
- Anthropic은 엔지니어들을 파견하여 워싱턴 D.C.로 보냈습니다. 한 미국 정부 관계자에 따르면, 회사는 모든 문제가 이미 해결되었으며 추가적인 변경 사항들은 미세 조정 (fine-tuning) 단계에 있을 뿐임을 증명하고자 했습니다.
- 하지만 미국 정부 관계자에 따르면, 연방 AI 표준 및 혁신 센터 (Center for AI Standards and Innovation)와 국가안보국 (National Security Agency)은 해당 변경 사항들이 충분하지 않다고 밝혔으며, 이는 추가적인 수정을 촉발했습니다.
- 해당 관계자는 여러 기관의 수장들이 점진적으로 변경 사항을 승인했으며, 7월 1일에 모델들이 출시되었다고 말했습니다.
행정부 관계자들 중 Amazon의 Andy Jassy가 연락할 수 있었던 인물은 많았으나, 별도의 소식통에 따르면 회사의 보고서에서 발견된 탈옥 (jailbreaking) 문제를 가장 먼저 접한 사람은 Scott Bessent 재무장관이었습니다.
- Bessent는 Mythos에 대해 조기에 경종을 울렸으며, 백악관 비서실장 Susie Wiles와 협력하여 곤경에 처한 회사를 다시 설득하고, 사이버 보안 행정 명령 (cybersecurity executive order)이 최종 통과되도록 도왔습니다.
- 탈옥 문제를 해결하기 위한 기술적 논의가 D.C.에서 진행되는 동안, 동맹국들이 안전 표준에 대한 글로벌 협력을 촉구했던 G7 회의에서 Trump 대통령의 곁을 지킨 것은 Bessent였습니다.
이 대립의 중심에는 Howard Lutnick 상무장관이 있었습니다. 그의 부처 팀들이 기술적 논의를 주도하는 동안, 그는 G7 회의에서 Trump의 곁을 지켰습니다.
- 다양한 소식통에 따르면, Sean Cairncross 국가 사이버 국장(National cyber director), 백악관 과학기술정책국(White House Office of Science and Technology Policy), 재무부 최고정보책임자(CIO) Sam Corcos, 그리고 NSA(미 국가안보국) 또한 기술적 논의에 모두 참여했습니다.
- 한 소식통은 워싱턴이 수십 차례의 회의를 소집하기 위해 더 빠르게 움직였으며, 단일 기술적 이슈를 위해 예상보다 훨씬 더 많은 기관을 동원했다고 전했습니다.
긴장은 고조되었습니다 성격 차이와 소통 부재 속에서 말입니다.
- 한 미국 정부 관계자는 Anthropic이 결국 성공하기 위해서는 정부와 같은 편에 서야 한다는 점을 이해하게 되었다고 말했습니다.
- 논의가 더욱 기술적으로 변함에 따라, Anthropic의 정책 책임자인 Sarah Heck와 Anthropic의 공동 창립자인 Tom Brown이 더 깊이 관여하게 되었습니다. Brown은 또한 6월 12일 주말 동안 Lutnick 및 Cairncross와 여러 차례 대화를 나누었습니다.
- 한 소식통은 Dario가 무대 뒤로 물러나고 다른 누군가가 그를 대신한 순간은 결코 없었다고 말하며, Brown의 기술적 전문성 덕분에 그가 정부 전문가들과 함께 방에 앉아 모델이 스트레스 상황에서 어떻게 작동하는지 한 줄씩 검토할 수 있었다고 덧붙였습니다.
행간의 의미: Anthropic의 모델들이 언제, 어떻게 전 세계 동맹국에 출시될지는 여전히 불확실합니다. 지지자들은 이것이 중국을 이기기 위한 핵심이라고 말합니다. 또한 OpenAI부터 Google에 이르기까지 다른 연구소들이 그들의 최신 모델을 어떻게 출시할지도 불분명합니다.
- 최신 모델인 GPT-5.6이 보류 상태인 OpenAI는 Anthropic과 백악관 사이의 논의 내용을 파악하지 못하고 있으며, 자체 모델의 출시와 관련하여 매일 기술적 논의에 참여하고 있다고 한 소식통은 전했습니다.
결론: 투명성 표준과 타임라인을 갖춘 명확하고 포용적인 프로세스를 통해 향후 모델을 승인하기 위한 프레임워크 구축에는 여전히 많은 작업이 남아 있다고 사안에 정통한 소식통들은 말했습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 Axios의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기