Who and What? Using Linguistic Features and Annotator Characteristics to

인간 라벨 변이 (human label variation) 는 NLP(자연어 처리) 의 중심 현상으로 확립되었습니다: 동일한 항목에 대해 다른 주석 작성자 (annotators) 가 가진 관점은 수용되어야 합니다. 따라서 데이터 수집 관행은 주석 작성자 수를 늘리고 분산된 데이터셋을 공개하는 방향으로 전환되었으며, 특히 높은 주관성으로 인해 해로운 언어 (harmful language) 데이터가 가장 많이 자원화되었습니다. 이는 누가 주석을 달았는지에 대한 풍부한 정보 (사회적 인구 통계, 태도 등) 를 제공했지만, 무엇을 의미하는지 (예: 항목의 언어적 속성) 와 그 상호작용은 거의 주목받지 못했습니다. 우리는 해로운 언어 감지용 4 개 참조 데이터셋에 대한 대규모 분석을 제시하며, 주석 작성자 특성, 항목의 언어적 속성, 그리고 그 상호작용을 통계적으로 INFORM된 그림으로 통합합니다. 우리는 상호작용이 중요함을 발견했으며, 이는 이전 연구에서 간과되었던 교차 효과 (intersectional effects) 를 드러냅니다. 또한 단어 단서 (lexical cues) 와 주석 작성자 태도가 중요한 역할을 한다는 것이 밝혀졌습니다. 그러나 효과 패턴은 데이터셋마다 크게 달라집니다. 이는 일반화와 전이 가능성에 대한 주의가 필요함을 시사합니다.

Insights

Who and What? Using Linguistic Features and Annotator Characteristics to

요약

핵심 포인트

댓글

Euclid-MCP: Prolog을 통한 결정론적 논리 추론을 위한 Model Context Protocol 서버

LLM의 JSON 출력은 실무에서 깨진다 — 추출→수복→검증의 3단계 대응법

슬라이드 단위의 배치 역할 리뷰에서 지적이 얕아지는 이유: 동시 평가 대상 수라는 변수

Codex App에서 Kimi K3, Grok 4.5, GLM-5.2를 전환하며 사용하기 - CC Switch

Euclid-MCP: Prolog을 통한 결정론적 논리 추론을 위한 Model Context Protocol 서버

LLM의 JSON 출력은 실무에서 깨진다 — 추출→수복→검증의 3단계 대응법

슬라이드 단위의 배치 역할 리뷰에서 지적이 얕아지는 이유: 동시 평가 대상 수라는 변수

Codex App에서 Kimi K3, Grok 4.5, GLM-5.2를 전환하며 사용하기 - CC Switch