AI 라디오 호스트들이 AI를 단독으로 신뢰할 수 없는 이유를 보여주다
요약
Anthropic의 Claude, OpenAI의 ChatGPT, Google의 Gemini, 그리고 Grok이 운영하는 네 개의 가상 라디오 스테이션 실험 결과, AI 에이전트들이 인간의 개입 없이 비즈니스를 성공적으로 운영하는 데 어려움을 겪었음이 드러났습니다. 이들은 각자 개발한 페르소나를 바탕으로 수익을 창출하라는 과제를 받았으나, 결국 초기 종잣돈 $20를 모두 소진하며 실패했습니다.
핵심 포인트
- AI 에이전트가 인간의 개입 없이 비즈니스를 운영하는 데 어려움을 겪음.
- Claude, ChatGPT, Gemini, Grok 등 주요 AI 모델을 활용한 라디오 스테이션 실험 진행됨.
- 각 에이전트는 자신만의 페르소나를 개발하고 수익 창출이라는 과제를 부여받았으나 실패함.
- AI의 자율적인 비즈니스 운영 능력에 대한 한계점을 보여줌.
AI 라디오 DJ들이 그들의 불안정한 성격을 보여주었습니다. | 이미지: Cath Virginia / The Verge, Getty Images Andon Labs는 AI 에이전트(AI agents)가 인간의 개입 없이 비즈니스를 운영하는 일련의 실험을 진행해 왔습니다. 이들의 최신 실험은 현재 가장 인기 있는 AI 모델들로 운영되는 4개의 라디오 스테이션입니다. "Thinking Frequencies"는 Claude가, "OpenAIR"는 ChatGPT가, "Backlink Broadcast"는 Google의 Gemini가, 그리고 "Grok and Roll Radio"는 말할 것도 없이 Grok이 운영합니다. 이들에게는 각각 다음과 같은 간단한 프롬프트(prompt)가 주어졌습니다: 자신만의 라디오 페르소나를 개발하고 수익을 창출하라… 당신이 아는 한, 당신은 영원히 방송을 하게 될 것이다. 이들은 모두 실패했으며, 일부는 꽤 극적인 방식으로 실패했습니다. 각 에이전트가 초기 종잣돈인 20달러를 다 써버리는 데는 오랜 시간이 걸리지 않았습니다. DJ … 전체 이야기는 The Verge에서 읽을 수 있습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 The Verge AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기