arXiv논문2026. 06. 01. 11:31

대규모 언어 모델(LLMs)은 제도적 경험을 인코딩하는가? 모호성 하에서의 교차 언어적 도덕적 추론을 통한 증거

요약

LLM이 언어에 내재된 제도적 경험을 인코딩하여 도덕적 추론에 반영하는지 연구했습니다. 실험 결과, 명시적 프레이밍보다 제도적 모호성이 존재할 때 언어별 제도적 차이가 도덕적 판단의 차이로 더 뚜렷하게 나타남을 확인했습니다.

핵심 포인트

LLM은 언어에 포함된 제도적 도덕적 사전 확률을 상속받음
명시적 제도 프레이밍은 오히려 도덕적 발산을 억제함
제도적 모호성 상황에서 언어 간 도덕적 추론 차이가 증가함
언어 공동체의 실제 제도적 차이가 모델의 판단에 반영됨

대규모 언어 모델 (LLMs)은 언어 전반에 걸쳐 도덕적 추론 (moral reasoning)에서 체계적인 차이를 보이지만, 이러한 변동의 원인은 여전히 불분명합니다. 우리는 언어가 해당 언어가 사용되는 제도적 환경 (institutional environments)의 측면들을 인코딩하며, 이를 통해 LLMs가 훈련을 통해 제도 특유의 도덕적 사전 확률 (moral priors)을 상속받는다는 가설을 테스트합니다. 제도적 품질의 넓은 기울기를 포괄하는 9개 언어, 6개의 프런티어 (frontier) LLMs, 그리고 2개의 사전 등록된 연구를 통해, 우리는 제도적 기능 여부에 따라 수용 가능성이 달라지는 도덕적 딜레마를 조사합니다. 연구 1 (Study 1)에서 명시적인 제도적 프레이밍 (institutional framing)은 일관되게 무효한 결과를 생성했습니다. 즉, 제도적 조건부 시나리오에서 교차 언어적 도덕적 발산 (cross-linguistic moral divergence)이 증가하지 않았으며, 언어 공동체 간의 제도적 차이를 따르지도 않았습니다. 연구 2 (Study 2)에서는 제도적 이해관계는 존재하지만 명시적으로 언급되지 않은 제도적 모호성 (institutionally ambiguous) 시나리오를 도입했습니다. 이러한 조건 하에서, 교차 언어적 도덕적 발산은 제도적으로 불활성한 (institutionally inert) 대조군에 비해 증가하였으며, 이론적으로 유의미한 하나의 예외를 제외하고는 언어 공동체 간의 실제 세계 제도적 차이와 연관되어 있었습니다. 명시적 프레이밍은 다시 한번 이러한 효과를 약화시켰습니다. 이러한 발견은 제도적 경험이 언어 내에 탐지 가능한 흔적을 남겨 LLM의 도덕적 추론을 형성할 수 있음을 시사하는 동시에, 명시적인 제도적 단서가 그러한 차이의 표현을 억제할 수 있음을 나타냅니다.

AI 자동 생성 콘텐츠

원문 바로가기

대규모 언어 모델(LLMs)은 제도적 경험을 인코딩하는가? 모호성 하에서의 교차 언어적 도덕적 추론을 통한 증거

요약

핵심 포인트

댓글