보정된 가치 페르소나를 통한 교차 문화 설문 시뮬레이션 개선 연구
요약
본 연구는 LLM을 활용한 교차 문화 설문 시뮬레이션 시, 기존의 사회인구학적 페르소나 방식이 가진 한계를 극복하기 위해 가치 기반 페르소나 구축 방법을 제안합니다. 텍스트 기술어를 통해 핵심 문화적 가치를 포착하고 보정 절차를 도입함으로써, 국가 간 예측 오차를 줄이고 과소 대표된 인구 집단의 응답 다양성을 향상시켰습니다.
핵심 포인트
- 기존의 사회인구학적/성격 기반 프롬프팅 대신 핵심 문화적 가치를 직접 반영하는 페르소나 구축 방식 제안
- 가치 프로필 샘플링과 응답 집계 과정을 통해 인구 수준의 예측 가능성 확보
- 추정된 의견을 유지하면서도 응답의 다양성을 높이는 보정(Calibration) 절차 도입
- 학습 데이터가 부족한 국가 및 과소 대표된 집단에서의 예측 성능 격차를 실질적으로 개선
대규모 언어 모델 (LLMs)은 인간의 의견과 설문 응답을 시뮬레이션하는 데 점점 더 많이 사용되고 있지만, 다양한 문화권에 걸쳐 인구 통계적 응답을 재현하는 능력은 여전히 제한적입니다. 기존의 페르소나 기반 프롬프팅 (Persona-based prompting) 방법들은 일반적으로 사회인구학적 특성이나 성격 특성에 의존하는데, 이는 인간의 응답을 형성하는 가치 (Values)를 간접적으로 나타내는 대리 지표일 뿐입니다. 본 연구에서는 핵심적인 문화적 차원을 포착하는 설문 응답으로부터 텍스트 기술어 (Textual descriptors)를 도출하는 가치 기반 페르소나 구축 방법을 제안합니다. 대상 인구 집단으로부터 가치 프로필 (Value profiles)을 샘플링하고 페르소나 전반에 걸쳐 LLM 응답을 집계함으로써, 관찰된 가치 분포에 근거한 인구 수준의 예측을 얻습니다. 나아가, 추정된 의견을 유지하면서 응답의 다양성을 향상시키는 보정 절차 (Calibration procedure)를 도입합니다. 실험 결과, 본 접근 방식은 국가 간 예측 오차를 줄이며, 특히 과소 대표된 인구 집단에서 가장 큰 개선 효과가 관찰되었습니다. 이는 지배적인 LLM 사전 지식 (Priors)과 일치하는 국가와 학습 데이터에서 덜 표현된 국가 사이의 성능 격차를 실질적으로 좁히는 동시에, 인간의 다양성과 밀접하게 일치하는 응답 분포를 생성합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.CL의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기