본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 04. 28. 16:56

터키어 증거형 (Evidential Morphology) 의 출처 민감성 검증: 신뢰도 조작 하에서 인간과 대형 언어 모델 (LLMs)

요약

본 연구는 터키어의 증거형(evidential morphology)이 정보 출처의 신뢰성에 민감하게 반응하는지, 그리고 대규모 언어 모델(LLMs)이 이러한 인간의 인지적 패턴을 얼마나 잘 모방하는지를 탐구합니다. 실험 결과, 터키어 원어민은 정보 출처에 대한 '신뢰 효과'를 명확히 보여, 높은 신뢰성 문맥에서는 한 형태(-DI)가, 낮은 신뢰성 문맥에서는 다른 형태(-mIs)가 더 자주 사용되는 경향을 보였습니다. 반면, LLMs는 모델과 프롬프트 방식에 따라 행동이 크게 달라지며, 전반적으로 불안정하고 일관성이 부족하여 인간의 출처 민감한 추론 능력을 완전히 재현하지 못하는 것으로 나타났습니다.

핵심 포인트

  • 터키어 원어민은 정보 출처의 인지된 신뢰도에 따라 증거형 접미사 사용 패턴에서 일관되고 견고한 '신뢰 효과'를 보인다.
  • LLMs는 오픈 갭 필, 명시적 과거 시제 갭 필 등 다양한 프롬프팅 패러다임 하에서 출처 민감성을 평가되었으나, 그 행동이 모델 및 프롬프트에 크게 의존하며 일관성이 떨어진다.
  • LLM의 증거형 사용 패턴은 종종 불안정하고, 기본률 선호도나 출력 준수 문제에 가려져 인간과 명확한 격차를 보인다.
  • 본 연구 결과는 터키어 증거성에 대한 신뢰/약속 기반 설명(trust-/commitment-based account)을 뒷받침하는 새로운 언어학적 증거를 제공한다.

본 논문은 출처의 신뢰성이 터키어의 증거형 (evidential morphology) 을 형성하는지, 그리고 대형 언어 모델 (LLMs) 이 이러한 민감성을 추적하는지를 조사합니다. 우리는 정보 출처가 명시적으로 외부인 통제된 빈칸 채우기 (cloze) 문맥에서 -DI 와 -mIs 의 과거 영역 (past-domain) 대비를 연구했습니다. 이때 실제 출처의 신뢰성은 조작되지 않았으나, 그 인지된 신뢰성만 조작 (High-Trust 대 Low-Trust) 되었습니다. 인간 생성 실험에서 터키어 모국어 화자는 견고한 신뢰 효과 (trust effect) 를 보였습니다: High-Trust 문맥에서는 상대적으로 -DI 가 더 많이 사용되고, Low-Trust 문맥에서는 상대적으로 -mIs 가 더 많이 나타났으며, 이 패턴은 민감도 분석 (sensitivity analyses) 을 통해 안정적으로 유지되었습니다. 이어 우리는 10 개의 LLM 을 오픈 갭 필 (open gap-fill), 명시적 과거 시제 갭 필 (explicit past-tense gap-fill), 그리고 강제 선택 A/B (forced-choice A/B selection) 의 세 가지 프롬프팅 패러다임에서 평가했습니다. LLM 의 행동은 모델 및 프롬프트에 크게 의존합니다: 일부 모델에서는 약하거나 국소적인 신뢰 일관성 있는 변화 (trust-consistent shifts) 를 보이지만, 효과는 일반적으로 불안정하며, 종종 뒤집히거나 출력 준수 문제 (output-compliance problems) 와 강한 기본률 접미사 선호도 (strong base-rate suffix preferences) 에 가려집니다. 이러한 결과는 터키어 증거성 (evidentiality) 에 대한 신뢰/약속 기반 설명 (trust-/commitment-based account) 에 대한 새로운 증거를 제공하며, 출처 민감성 증거 추론 (source-sensitive evidential reasoning) 에서 명확한 인간-LLM 간 격차를 드러냅니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.CL의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
4

댓글

0