arXiv논문2026. 06. 30. 11:10

평균을 넘어: 소규모 파일럿 데이터를 활용한 LLM 기반 설문 시뮬레이터 정렬을 위한 3축 충실도 (Three-Axis Fidelity)

요약

LLM을 활용한 사회 설문 시뮬레이션 시 발생하는 통계적 편향을 해결하기 위해 '3축 충실도(Three-Axis Fidelity)' 개념을 제안합니다. 소규모 파일럿 데이터를 활용해 구조적, 주변, 개별 충실도를 복구하는 프롬프팅, 교정, 미세 조정 기법을 벤치마킹하여 연구했습니다.

핵심 포인트

LLM 설문 시뮬레이션의 체계적 편향(분포 왜곡, 분산 미보정 등) 문제 제기
구조적, 주변, 개별 충실도의 세 가지 축으로 복구 과정 정의
프롬프팅, 교정, 미세 조정 방식의 성능 비교 및 벤치마킹 수행
미세 조정이 균형 잡힌 접근법이나 하위 샘플에 따라 충실도가 달라질 수 있음

대규모 언어 모델 (LLMs)은 사회 설문 응답을 시뮬레이션하는 데 점점 더 많이 사용되고 있지만, 그 출력값은 체계적인 편향을 보입니다. 즉, 주변 분포 (marginal distributions)가 왜곡되고, 응답 분산 (response variance)의 보정이 제대로 이루어지지 않으며, 예측 변수-결과 (predictor-outcome) 관계가 약화됩니다. 우리는 다음과 같은 간단한 질문을 던집니다. 인간 응답의 소규모 파일럿 샘플 (pilot sample)이 주어졌을 때, LLM이 더 넓은 모집단의 통계적 특성을 복구할 수 있는가? 우리는 복구 과정을 세 가지 축, 즉 구조적 충실도 (structural fidelity), 주변 충실도 (marginal fidelity), 그리고 개별 충실도 (individual fidelity)로 분해합니다. COVID-19 오정보 설문 조사를 사례 연구로 사용하여, 우리는 프롬프팅 (prompting), 교정 (rectification), 그리고 미세 조정 (fine-tuning)이라는 세 가지 접근 방식의 계열을 벤치마킹합니다. 연구 결과는 소규모 파일럿 샘플에 대한 미세 조정 (fine-tuning)이 여러 형태의 충실도를 달성하기 위한 균형 잡힌 접근 방식을 제공하지만, 이러한 충실도의 수준은 하위 샘플 (subsamples)에 따라 달라질 수 있으며, 이는 잠재적으로 다원적 정렬 (pluralistic alignment)을 위협할 수 있음을 시사합니다.

AI 자동 생성 콘텐츠

원문 바로가기

평균을 넘어: 소규모 파일럿 데이터를 활용한 LLM 기반 설문 시뮬레이터 정렬을 위한 3축 충실도 (Three-Axis Fidelity)

요약

핵심 포인트

댓글