arXiv논문2026. 06. 15. 11:14

AI 생성 이야기에서의 문화적 현지화 특성 분석

요약

AI가 생성하는 이야기의 문화적 현지화 방식을 템플릿 기반과 총체적 방식으로 구분하여 분석하는 연구입니다. 어휘적 차이를 제거한 후에도 공통된 서사 템플릿이 존재함을 확인하였으며, 특정 국가의 문화적 표식이 편향되거나 모욕적일 수 있음을 밝혔습니다.

핵심 포인트

문화적 현지화의 두 가지 방식(템플릿 기반 vs 총체적) 정의
국가 간 차이를 만드는 어휘는 전체의 9-17%에 불과함
문화적 중립적 서사 템플릿의 존재 확인
글로벌 사우스 국가들에 대한 문화적 표식의 모욕성 발견

인공지능 (AI)의 전 세계적인 사용은 이야기를 포함하여 문화적으로 현지화된 콘텐츠를 생성하는 능력을 평가하는 것에 대한 관심을 높였습니다. 이야기에서의 문화적 현지화 (Cultural localization)는 종종 템플릿 기반 현지화 (templated localization) — 즉, 일반적인 서사 내에서 문화적 표식 (예: 이름, 장소)을 사용하는 방식 — 또는 총체적 현지화 (holistic localization) — 문화적 표식 외에도 플롯, 가치, 주제가 변화하는 방식 — 를 통해 발생합니다. 우리는 콘텐츠가 템플릿 기반 현지화를 통해 생성된 정도를 측정하는 방법을 제안합니다. 구체적으로, 우리는 국가 간에 이야기를 구분 짓는 어휘 토큰 (lexical tokens)을 식별하고, 이를 제거한 후 남은 서사의 유사성을 측정합니다. 193개 국적에 대한 125개 주제를 대상으로 5개의 모델이 생성한 이야기에서, 우리의 방법은 어휘의 아주 작은 부분(9-17%)만이 국가 간의 차이를 설명한다는 점과, 이를 제거한 후 남은 서사들이 반복적인 다어구 시퀀스 (multi-word sequences)를 포함하고 있어 공유된 문화적 중립적 (culturally-agnostic) 서사 템플릿의 존재를 시사한다는 점을 탐지할 수 있습니다. 마지막으로, 우리는 문화적 표식의 정형성 (stereotypicality)과 모욕성 (offensiveness)을 특성화하였으며, 주로 글로벌 사우스 (Global South)에 위치한 19개국의 표식들이 평균적으로 모욕적이라는 것을 발견했습니다.

AI 자동 생성 콘텐츠

원문 바로가기

AI 생성 이야기에서의 문화적 현지화 특성 분석

요약

핵심 포인트

댓글