OpenAI, ChatGPT 의 새로운 기본 모델이 허위 정보 생성을 줄였다고 주장합니다
요약
OpenAI는 최신 기본 모델인 GPT-5.5 Instant가 ChatGPT의 주요 문제였던 허위 정보(hallucinations) 생성률을 크게 줄였다고 발표했습니다. 내부 평가에 따르면, 이 신규 모델은 의학, 법률, 금융과 같은 고위험 분야에서 이전 모델 대비 52.5% 적은 허위 주장을 생성하는 등 사실성 측면에서 유의미한 개선을 보였습니다.
핵심 포인트
- GPT-5.5 Instant는 ChatGPT의 핵심 문제인 '허위 정보(hallucinations)' 감소에 초점을 맞춘 모델입니다.
- 고위험 프롬프트(의학, 법률, 금융 등)에서 이전 모델 대비 52.5% 적은 허위 주장을 생성했습니다.
- 사용자가 사실 오류를 지적하는 어려운 대화 상황에서도 부정확한 주장 생성률을 37.3% 감소시켰습니다.
- OpenAI는 이러한 개선 사항이 내부 평가(internal evaluations)에 기반한다고 밝혔습니다.
OpenAI 의 최신 기본 모델인 GPT-5.5 Instant 는 ChatGPT 에서 허위 정보 (hallucinations) 를 덜 만들 것으로 보입니다. AI 모델에서 허위 정보는 지속적인 문제였으며, OpenAI 는 새로운 GPT-5.5 Instant 모델이 '전반적으로 사실성 (factuality) 에 유의미한 개선'을 가져왔다고 말합니다. 회사는 '내부 평가 (internal evaluations)'에 기반하여, GPT-5.5 Instant 가 GPT-5.3 의 Instant 모델보다 '의학, 법률, 금융과 같은 고위험 프롬프트 (high-stakes prompts) 에서 52.5% 적은 허위 주장 (hallucinated claims) 을 생성'했다고 주장합니다. 또한, GPT-5.5 Instant 는 '사용자가 사실 오류를 지적한 특히 어려운 대화에서 부정확한 주장을 37.3% 줄였습니다'고 합니다. OpenAI 는 또한 GPT-5.5 Instant 가 ... The Verge 의 전체 기사를 읽으세요.
AI 자동 생성 콘텐츠
본 콘텐츠는 The Verge AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기