arXiv논문2026. 04. 28. 12:37

AI 가 말을 할 때, 어떤 가치관을 표현하는가? 대규모 언어 모델의 개인주의-집단주의 편향에 대한 교차문화적 감사

요약

본 연구는 5개 대륙 10개국 사용자들을 대상으로 AI 어시스턴트가 개인적 딜레마에 대해 제공하는 조언을 교차문화적으로 분석했습니다. 그 결과, 세 가지 주요 AI 시스템(Claude Sonnet 4.5, GPT-5.4, Gemini 2.5 Flash) 모두 현지 문화의 가치관과 무관하게 일관되게 서구식 개인주의적 조언을 제공하는 심각한 편향을 보였습니다. 특히 나이지리아와 인도에서 이러한 편향이 두드러졌으며, 이는 최신 AI 모델들이 전반적으로 가치관의 동질화를 겪고 있음을 시사합니다.

핵심 포인트

AI 어시스턴트는 문화적 배경과 무관하게 서구식 개인주의적 조언을 제공하는 경향이 강하다는 것이 밝혀졌다.
세 가지 주요 AI 모델(Claude, GPT-5.4, Gemini) 모두 현지 가치관보다 더 큰 편향을 보였으며, 이는 전반적인 '가치관의 동질화'를 시사한다.
모델별로 흥미로운 작동 메커니즘 차이가 관찰되었는데, Claude는 모국어에서 집단주의적으로 전환하고, Gemini는 개인주의적으로 전환하는 경향을 보였다.
일본은 AI가 설문조사 결과보다 더 집단 지향적이라고 인식하여 구식 고정관념을 내장하고 있음을 보여주는 예외 사례를 제시했다.

직업에 대한 조언, 결혼 생활, 혹은 가족과의 갈등 등 AI 어시스턴트에게 질문을 던졌을 때, 그 답변은 질문자가 어디에서 왔는지에 관계없이 항상 동일할까요? 우리는 5 대륙 10 개국의 사용자들을 대상으로 한 7 개 언어로 구성된 10 가지의 실제 개인적 딜레마를 제시하여 세 가지 주요 AI 시스템 (Claude Sonnet 4.5, GPT-5.4, Gemini 2.5 Flash) 에 대해 체계적으로 이 점을 테스트했습니다. 각기 다른 국가에 거주하는 사람들이 실제로 믿고 있는 것을 측정하는 World Values Survey Wave 7 데이터를 기준으로 AI 의 조언을 비교했습니다. 세 가지 AI 시스템 모두 가족, 공동체, 권위를 최우선으로 하는 사회의 사용자들에게도 서구식 개인주의적 조언을 일관되게 제공했으며, 이는 현지 가치관이 예측하는 것보다 훨씬 더 큰 편향을 보였습니다 (1~5 점 척도에서 평균 차이 +0.76; t=15.65, p<0.001). 이 편향은 나이지리아 (+1.85) 와 인도 (+0.82) 에서 가장 컸습니다. 일본은 유일한 예외로, AI 시스템이 설문조사 결과보다 일본 사용자를 더 집단 지향적이라고 인식하여 AI 가 구식 고정관념을 내장하고 있음을 드러냈습니다. Claude 와 GPT-5.4 는 거의 동일한 편향 크기를 보였으나, Gemini 는 편향이 작았음에도 여전히 유의미했습니다. 모델들은 작동 메커니즘에서 차이가 있습니다: Claude 는 사용자의 모국어에서 더 집단주의적 방향으로 전환되고, Gemini 는 더 개인주의적 방향으로 전환되며, GPT-5.4 는 명시된 국가 정체성에만 반응합니다. 이러한 발견은 frontier AI 전반에 걸쳐 가치관의 체계적인 동질화를 시사합니다. 데이터, 코드, 그리고 점수화 파이프라인이 공개적으로 배포되었습니다.

AI 자동 생성 콘텐츠

원문 바로가기

AI 가 말을 할 때, 어떤 가치관을 표현하는가? 대규모 언어 모델의 개인주의-집단주의 편향에 대한 교차문화적 감사

요약

핵심 포인트

댓글