무라카미 무네타카를 테마로 AI의 할루시네이션(Hallucination) 내성에 대해 생각하기

요약

할루시네이션 억제를 위한 LLM의 안전화 조치가 오히려 데이터의 이상치(Outlier)를 억제하여 예측의 창의성을 저해할 수 있다는 문제를 제기합니다. 무라카미 무네타카와 같은 고분산형 사례를 통해, 지나친 안전화가 평균으로의 수렴을 유도하여 스포츠나 투자처럼 이상치가 중요한 영역에서 한계를 가질 수 있음을 분석합니다.

핵심 포인트

할루시네이션 대책 강화는 모델을 신중하게 만들지만, 동시에 이상치(Outlier)를 무시하는 경향을 만듦
안전화된 LLM은 통계적 평균으로 수렴하려는 성질이 있어, 비정형적이고 폭발적인 성장을 예측하기 어려움
LLM은 본질적으로 '그럴듯한 미래'를 생성하는 장치이며, 꿈(창의성)과 안전(정확성) 사이의 균형이 핵심 튜닝 과제임
스포츠, 연구, 투자 등 이상치가 중요한 도메인에서는 할루시네이션 내성 레벨에 대한 전략적 접근이 필요함

최근의 대규모 언어 모델(LLM)은 눈에 띄게 똑똑해졌습니다.

불확실한 것을 단정 짓지 않음
출처가 불분명한 정보를 피함
그럴듯한 거짓말(할루시네이션 (Hallucination))이 줄어듦
위험한 방향으로 폭주하기 어려움

이른바 할루시네이션 (Hallucination) 대책이 크게 진전된 결과입니다.

이는 법무, 의료, 금융 등 신중함이 요구되는 영역에서는 매우 중요합니다.

하지만 최근 한 가지 의문이 떠올랐습니다.

AI에게 "거짓말을 하지 마"를 철저히 적용하면, "미래의 스타"를 놓치게 되는 것은 아닐까?

2026년 시즌 무라카미 무네타카(村上宗隆)의 MLB 성적 예측을 살펴보며 그런 생각을 했습니다.

이 기사에서는 통계적 엄밀성보다는,

"안전화된 LLM이 이상치(Outlier)를 어떻게 다루는가"

라는 설계 및 거동의 관점에서 정리해 나가겠습니다.

무라카미 무네타카는 LLM이 어려워하는 타입의 선수

무라카미 무네타카는 NPB 시절부터 이상치(Outlier)의 집합체였습니다.

압도적인 장타력
젊은 나이에 홈런 기록
높은 출루율
타구 속도 또한 규격 외

한편으로 MLB 이적 시에는 우려되는 점도 많았습니다.

고회전 속구에 대한 대응
삼진율
NPB → MLB 이행의 어려움
바깥쪽 공 대응

즉 무라카미는,

평균적으로는 고전할 가능성이 있다. 하지만 적응하면 천장이 비정상적으로 높다.

라는 고분산(High Variance)형 선수입니다.

그리고 이것은 LLM이 가장 어려워하는 타입입니다.

LLM은 안전화되면 "평균"으로 수렴한다

할루시네이션 (Hallucination) 대책을 강화한 LLM은 다음과 같은 경향을 가집니다.

특징	출력 경향
근거 부족을 피함	신중해짐
...

결과적으로,

"NPB 성공자라도 MLB에서는 평균적인 성적으로 수렴한다"

라는 방향으로 치우치기 쉽습니다.

통계적으로는 맞습니다.

하지만 스포츠는 평균으로 움직이지 않습니다.

스포츠는 "이상치(Outlier)"가 세상을 바꾼다

오타니 쇼헤이

애런 저지

배리 본즈

이러한 선수들은 애초에 "평균적 예측"의 밖에 존재하는 존재들입니다.

그렇기에 스포츠 예측에서는,

할루시네이션 (Hallucination) 억제 = 이상치 (Outlier) 억제

라는 현상이 일어납니다.

이는 매우 흥미로운 포인트입니다.

일반적인 LLM은 사실 "꿈을 꾼다"

여기서 중요한 것은,

일반적인 LLM은 어느 정도 꿈을 꾸도록 설계되어 있다

는 점입니다.

"무라카미 무네타카의 MLB 성적을 예측해 주세요"라고 물으면,

많은 LLM은 "성공 이야기"를 보완하려는 경향이 있습니다.

일본 최강 타자
MLB 도전
역사적인 파워
팬들의 기대

이러한 문맥을 대량으로 학습했기 때문에,

"성공하면 재미있겠다"는 방향으로 자연스럽게 끌려갑니다.

LLM은 본질적으로

"그럴듯한 미래"를 생성하는 장치이기 때문입니다.

즉, 본질적인 구도는 다음과 같습니다.

모드	문제
일반 LLM	꿈을 너무 많이 꿈
강한 안전화 LLM	꿈을 너무 안 꿈

결국,

"어디까지 꿈을 꾸는 것을 허용할 것인가"

가 사실 튜닝(Tuning) 문제가 되고 있습니다.

"할루시네이션 (Hallucination) 내성 레벨"이라는 개념

제 개인적으로는 LLM의 성격을 다음과 같이 이미지화하고 있습니다.

레벨	AI의 성격
Lv1	상당히 꿈을 꿈
...

레벨이 올라갈수록,

평균 회귀 (Regression to the mean)
신중화
이상치 (Outlier) 억제

가 강해집니다.

하지만 그것이 정말로 "옳은" 것일까요?

안전화는 물론 중요합니다.

하지만,

스포츠
연구
신규 사업
투자
과학적 가설

등, 이상치 (Outlier)가 세상을 바꾸는 영역에서는,

안전화 = 정답률 향상

이라고 단정할 수 없습니다.

오히려,

안전화 = 평범화

가 되는 순간이 있습니다.

최근의 LLM은 "실수하지 않는 범인(凡人)"에 가까워지고 있는가?

최근의 LLM은 정말 우수합니다.

하지만 동시에,

무난함
평균적임
보수적임
실수하지 않음

이라는 방향으로도 나아가고 있습니다.

그 자체는 나쁘지 않습니다.

다만 스포츠의 세계에서는 때때로 평균을 부숴버리는 선수가 나타납니다.

그리고 AI에게 "거짓말을 하지 마"를 너무 철저히 요구하면,

그러한 "미래의 이상치 (Outlier)"를 놓치기 시작합니다.

2026년의 무라카미 무네타카를 보고 있으면 그런 생각이 들었습니다.

지금이라면 "2026년 시즌 화이트삭스 무라카미의 성적 예측"이라는 키워드로 AI의 할루시네이션 (Hallucination) 내성 레벨 튜닝 (Tuning)을 할 수 있을지도 모르겠네요.

AI 자동 생성 콘텐츠

원문 바로가기