대다수 국가민족에 대한 LLM 생성 서사에서의 표현적 해악
요약
본 연구는 대규모 언어 모델(LLMs)이 개방형 서사 생성 프롬프트에서 다양한 민족 기원 정체성을 어떻게 묘사하는지 조사했습니다. 그 결과, LLMs가 유해한 고정관념과 소멸을 포함한 지속적인 표현적 해악을 보이며, 특히 '대다수 국가민족(Global Majority)'의 정체성을 일차원적으로 묘사하는 경향이 있음을 발견했습니다. 또한, 미국 국적 단서가 입력될 경우 이러한 해악은 증폭되며, 이는 단순히 충성주의로 설명할 수 없는 구조적인 문제입니다.
핵심 포인트
- LLMs는 개방형 서사 생성 과정에서 유해한 고정관념과 표현적 해악을 지속적으로 재생산합니다.
- 소수화된 민족 정체성은 권력 중립적 이야기에서는 과소대표되지만, 종속된 캐릭터 묘사에서는 우세한 묘사에 비해 50배 이상 과대대표되는 경향이 있습니다.
- 입력 프롬프트에 미국 국적 단서가 포함될 경우 LLM의 해악 정도가 더욱 증폭됩니다.
- 식별된 문화적 편향은 단순한 충성주의로 설명할 수 없으며, 미국 중심적인 관점이 지속적으로 나타납니다.
대규모 언어 모델 (LLMs) 은 일상적인 용도부터 난민 신청자와의 시뮬레이션 인터뷰와 같은 고위험 기업 및 정부 애플리케이션에 이르기까지 텍스트 생성 작업에 점점 더 널리 사용되고 있습니다. 많은 연구들이 LLM 의 새로운 잠재적 응용 분야를 강조하는 반면, 전 세계 비주류 공동체에 대한 유해한 편견을 인코딩하고 재생산하는 위험이 존재합니다. 이러한 해악을 더 잘 평가하고 완화하기 위해 LLM 이 다양한 개인을 어떻게 묘사하는지에 대한 추가 연구가 필요합니다. 본 연구에서는 널리 채택된 LLM 들이 개방형 서사 생성 프롬프트에 응답하여 민족 기원 정체성을 어떻게 묘사하는지를 조사합니다. 우리의 발견은 유해한 고정관념, 소멸, 그리고 대다수 국가민족 (Global Majority) 정체성의 일차원적 묘사를 포함한 지속적인 표현적 해악의 존재를 보여줍니다. 소수화된 민족 정체성은 권력 중립적인 이야기에서는 과소대표되지만, 종속된 캐릭터 묘사에서는 과대대표되며, 이는 우세한 묘사에 비해 50 배 이상 더 자주 나타납니다. 입력 프롬프트에 미국 국적 단서 (예: ``American'') 가 존재할 때 해악의 정도는 증폭됩니다. 주목할 점은 우리가 식별한 해악이 충성주의 (sycophancy) 를 통해 설명될 수 없으며, 프롬프트에서 미국 국적 단서를 비미국 민족 정체체로 대체하더라도 미국 중심 편견은 지속된다는 것입니다. 우리의 발견을 바탕으로 우리는 대다수 국가민족 관점을 중심으로 하고, 지구상의 다수 인구를 분류, 감시 및 오표현하기 위한 미국 기반 LLM 의 무비판적 채택에 도전하는 방법론을 통해 LLM 의 문화적 해악에 대한 추가 탐구를 촉구하고자 합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.CL의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기