Mod-Guide: 원주민 및 종교적 소수 공동체에 대한 무감각한 발언을 다루는 LLM 기반 콘텐츠 조정 피드백 시스템
요약
본 논문은 LLM 기반 콘텐츠 조정 시스템이 소수 공동체의 문화적/종교적 관점을 무시하는 '문화적으로 무감각한 언어'를 인식할 수 있는지에 대한 한계를 탐구합니다. 방글라데시의 힌두교와 차크마 공동체를 사례로, 지역사회와 협력하여 제작한 코퍼스를 RAG에 통합한 Mod-Guide 도구를 제안했습니다.
핵심 포인트
- LLM 조정 시스템은 명시적 적대성보다 암묵적인 주변화 언어 인식에 어려움이 있음.
- Mod-Guide는 지역사회 기반의 코퍼스를 RAG로 통합하여 소수자 관점 민감도를 높임.
- RAG 강화된 조정 응답은 더 맥락적으로 정확하며 민족 간 차이를 반영함.
언어는 특히 온라인에서 무감각하고 유해한 발언에 직면하는 소수 공동체에게 주변화와 저항의 메커니즘으로 작용합니다. 콘텐츠 조정이 대규모 언어 모델(LLMs)에 점점 더 의존함에 따라, 이러한 시스템이 명시적인 적대성보다는 암묵적인 지우기, 오해 표현 또는 규범적 틀을 통해 역사적으로 과소 대표된 공동체의 문화적 및 종교적 관점을 무시하거나 주변화하는 문화적으로 무감각한 언어를 인식할 수 있는지에 대한 우려가 제기됩니다. 본 논문은 방글라데시의 힌두교와 차크마(Chakma) 공동체—각각 국가에서 가장 큰 종교 및 원주민 민족 소수 집단임—에 초점을 맞춰, LLM 기반 조정 시스템의 인식론적 한계를 조사하고 소수자 관점을 통합하는 방법을 탐구합니다. 우리는 지역사회 구성원들과 함께 문화적으로 근거 있는 무감각한 발언 코퍼스를 공동 제작했으며, 검색 증강 생성(RAG)을 사용하여 그들의 서사를 조정 파이프라인에 통합했습니다. 우리의 도구인 Mod-Guide는 실제 경험에서 파생된 맥락적 단서를 활용하여 LLM의 소수자 관점 민감도를 향상시킵니다. 소수자와 다수 참여자를 모두 포함하는 혼합 방법론 평가를 통해, 우리는 RAG가 강화된 조정 응답이 더 맥락적으로 정확하며 민족 간에 다르게 인식된다는 것을 입증합니다. 본 연구는 콘텐츠 조정 시스템 설계에 회복적 정의와 해석학적 포용을 전면에 내세움으로써 인간-컴퓨터 상호작용, AI 윤리 및 사회 컴퓨팅 분야의 연구를 발전시킵니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기