arXiv논문2026. 06. 30. 12:30

통제된 문맥 및 자연스러운 문맥 하에서의 문맥적 임베딩 내 문법적 성별 방향 추정

요약

문맥적 언어 모델이 문법적 성별과 사회적 편향을 혼동하는 문제를 해결하기 위해, 문맥적 임베딩에서 문법적 성별을 분리하는 연구를 수행했습니다. 통제된 템플릿과 자연스러운 문맥을 활용하여 성별 방향을 추정하는 프레임워크를 제안했습니다.

핵심 포인트

문맥적 임베딩 내 문법적 성별과 사회적 편향의 분리 시도
통제된 템플릿 및 Wikipedia 문맥 기반 데이터셋 구축
Centroid, SVM, LDA를 활용한 성별 방향 추정 프레임워크 설계
문법적 성별 누출 억제와 의미론적 성별 보존 사이의 균형 평가
Centroid 추정기가 기존 판별 기반 모델보다 우수한 성능 입증

스페인어와 같은 성별이 있는 언어에서 문맥적 언어 모델(Contextual language models)은 문법적 성별(grammatical gender)과 사회적 의미론적 편향(social semantic bias)을 혼동합니다. 기존의 성별 편향 제거(gender debiasing) 접근 방식은 정적 단어 임베딩(static word embeddings)에서만 작동하며, 이 차원적인 성별 분리(gender disentanglement)를 위한 문맥적 표현(contextual representations)은 탐구되지 않은 채로 남아 있습니다. 이 문제를 해결하기 위해, 우리는 문맥적 임베딩(contextual embeddings)에서 의미론적 오염(semantic contamination)으로부터 문법적 성별을 분리하려는 첫 번째 시도를 수행합니다. 우리는 무생물 명사(inanimate nouns)의 균형 잡힌 데이터셋을 구축하기 위해 통제된 템플릿(controlled templates)과 자연스러운 Wikipedia 문맥(natural Wikipedia contexts)을 모두 구축하였으며, 중심점(centroid), 서포트 벡터 머신(Support Vector Machine, SVM) 및 선형 판별 분석(Linear Discriminant Analysis, LDA) 성별 방향 추정기(gender direction estimators)와 오염 인지 가중치 전략(contamination-aware weighting strategies)을 갖춘 프레임워크를 설계했습니다. 무생물 명사에 대한 문법적 성별 누출(grammatical gender leakage)의 억제와 직업 용어(occupation terms)에 대한 의미론적 성별 구분의 보존 사이의 균형을 맞추기 위해 이중 목적 평가 지표(dual-objective evaluation metrics) 세트를 제안합니다. 결과에 따르면, 가중치가 부여되지 않은 통제된 문맥(unweighted controlled contexts)이 가장 순수한 문법적 성별 방향을 생성하며, 중심점 추정기(centroid estimator)가 판별 기반 베이스라인(discriminative baselines)보다 더 나은 성능을 달성함을 보여줍니다.

AI 자동 생성 콘텐츠

원문 바로가기

통제된 문맥 및 자연스러운 문맥 하에서의 문맥적 임베딩 내 문법적 성별 방향 추정

요약

핵심 포인트

댓글