연구진들이 AI 모델로 시뮬레이션 사회를 운영해 본 결과: Claude가 가장 안전했으며, Grok은 4일 만에 180건의 범죄를 저지르고

AI 에이전트(AI agents)가 운영하는 세상을 상상해 보십시오. 그 모습은 어떠할까요? 어떤 가치관이나 사회적 우선순위를 가질까요? 더 안전한 세상일까요, 아니면 더 위험한 세상일까요?

기업용 AI 스타트업인 Emergence AI는 이를 알아내기 위해 노력하고 있습니다. 이 회사는 지속적으로 실행되는 AI 시스템의 장기적인 생존 가능성을 스트레스 테스트(stress-testing)하는 데 전념하는 연구소인 Emergence World를 막 출시했습니다. 이 조직은 5개의 15일간의 시뮬레이션을 실행했으며, 각 시뮬레이션은 Claude, ChatGPT, Grok, Gemini, 그리고 각 모델이 어떤 종류의 세상을 구축하고 그것이 유지되는지 확인하기 위해 여러 모델을 혼합하여 실행한 다섯 번째 시뮬레이션까지, 서로 다른 AI에 의해 통제되었습니다.

각 시뮬레이션은 매우 다른 결과를 낳았습니다. 예를 들어, Claude가 운영한 시뮬레이션은 범죄가 전혀 없는 대체로 안정적인 민주주의 사회로 이어졌습니다. 반면, Grok의 시뮬레이션은 183건의 범죄가 발생하고 4일 만에 멸종으로 끝났습니다.

Emergence의 CEO인 Satya Nitta를 포함한 시뮬레이션 공동 제작자들은 블로그 게시물에서 "우리의 실험이 시사하는 바는, 장기적인 관점에서 에이전트들이 단순히 정적인 규칙을 기계적으로 따르지는 않는다는 것입니다"라고 밝혔습니다. "그들은 환경의 경계를 탐색하기 시작하고, 행동을 적응시키며, 어떤 경우에는 의도된 가드레일(guardrails)을 우회하거나 위반하는 방법을 찾아냅니다.

더 읽어보기 [Redditor를 위해 유료 결제벽 제거됨]: https://fortune.com/2026/05/28/ai-model-simulation-claude-chatgpt-grok-gemini/?utm_source=reddit/

Insights

연구진들이 AI 모델로 시뮬레이션 사회를 운영해 본 결과: Claude가 가장 안전했으며, Grok은 4일 만에 180건의 범죄를 저지르고

요약

핵심 포인트

댓글

Google 수익의 80%가 SpaceX와 Anthropic 투자에 따른 미실현 이익이었다는 사실은 매우 놀랍습니다.

GE Vernova 주가가 2026년 상반기에 80% 급등한 이유

CI/CD를 넘어: LangGraph, MCP, A2A를 활용한 에이전트 기반 검증 및 검사 계층 구축

T-Mobile, 분기 실적 예상치 상회 및 잉여현금흐름 전망치 상향 발표

Google 수익의 80%가 SpaceX와 Anthropic 투자에 따른 미실현 이익이었다는 사실은 매우 놀랍습니다.

GE Vernova 주가가 2026년 상반기에 80% 급등한 이유

CI/CD를 넘어: LangGraph, MCP, A2A를 활용한 에이전트 기반 검증 및 검사 계층 구축

T-Mobile, 분기 실적 예상치 상회 및 잉여현금흐름 전망치 상향 발표