본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 05. 12. 00:13

그녀는 정말 관련성이 있을까? BERT가 명시적인 성별 단서를 무시할 때

요약

본 논문은 네덜란드어와 같이 형태론적 성별을 가진 언어를 대상으로 BERT 모델의 성별 편향성을 분석합니다. 연구진은 훈련 과정 전반에 걸쳐 문맥 임베딩을 추적하여, 명시적인 성별 단서가 모델 표현에 어떻게 인코딩되고 진화하는지 조사했습니다. 그 결과, Dutch BERT 모델이 반(反)고정관념적인 문맥에서 명시적인 성별 정보를 충분히 반영하지 못하고 지속적으로 남성 기본값 행동을 보이는 경향이 있음을 발견했습니다.

핵심 포인트

  • LLM의 성별 편향성은 영어 중심이었으나, 형태론적 성별 언어에 대한 연구가 부족했다.
  • 연구는 네덜란드 BERT 모델을 사용하여 훈련 과정 중 성별 정보의 인코딩 과정을 분석했다.
  • 문맥 임베딩을 추적한 결과, 명시적인 성별 단서가 최종 표현에 신뢰성 있게 반영되지 않았다.
  • Dutch BERT 모델은 반(反)고정관념적 문맥에서도 남성 기본값 행동을 보이는 경향이 확인되었다.

대규모 언어 모델(LLM)의 성별 편향성은 주로 영어에 대해 조사되어 왔으며, 문법적 또는 형태론적 성별을 가진 언어들은 비교적 연구가 부족한 상태입니다. 본 논문은 네덜란드 BERT 모델이 처음부터 훈련되는 과정에서 성별 정보가 어떻게 그리고 언제 나타나는지 조사하며, 명시적인 형태론적 성별 표기와 일반적인 형태를 결합하는 언어의 트랜스포머(Transformer) 아키텍처에서 편향 형성의 체크포인트 수준 분석 중 하나를 제공합니다. 훈련 전반에 걸쳐 문맥 임베딩을 추출하여, 선형 SVM(linear SVMs)을 사용하여 동적 성별 부분 공간(dynamic gender subspaces)을 구성하고, 성별이 언제 선형적으로 인코딩되는지 그리고 이 인코딩이 시간이 지남에 따라 어떻게 진화하는지를 추적합니다. 문맥 임베딩은 종종 문맥 단서들을 강력하게 통합한다고 가정되며, 이는 m

심지어 문맥이 명시적으로 여성 지칭을 나타낼 때도 그렇습니다. 종합적으로 볼 때, 저희 Dutch BERT 모델이 학습한 표현에서의 문맥화(contextualization)가 탐색된 성별 방향을 따라 충분히 역동적이지 않은 것으로 보입니다: 반(反)고정관념적인 문맥에서 명시적인 성별 단서가 결과적인 표현에 신뢰성 있게 반영되지 않아 지속적인 남성 기본값 행동(male-default behaviour)이 나타납니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.CL의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0