예술 걸작이나 관광 클리셰를 넘어선 문화적 정렬 평가: LLM 을 위한 문화적 정렬 평가 방법

대형 언어 모델 (LLMs) 의 문화적 (부적절) 정렬은 종종 문화적 편향이라는 용어로 표현되어 왔지만, 최근까지도 문화적 평가를 위한 데이터셋의 설계 및 개발에 대한 연구는 제한적이었습니다. 본 논문에서는 이러한 데이터셋에 대한 기존 접근법을 검토하고 주요 한계를 규명합니다. 이 문제를 해결하기 위해 주안노터 (annotators) 를 위한 설계 지침을 제안하며, 이러한 원칙에 따라 구축된 데이터셋의 구성 결과를 보고합니다. 또한 해당 데이터셋을 활용한 일련의 대조 실험을 제시합니다. 결과는 우리의 설계가 동등한 조건 (ceteris paribus) 에서 특정 문화에 특화된 모델과 그렇지 않은 모델을 효과적으로 구별할 수 있는 더 높은 판별력을 가진 테스트 세트를 제공함을 보여줍니다.