Bye Bye Perspective API: NLP, CSS 및 LLM 평가의 측정 인프라에 대한 교훈

2026 년 말에 Perspective API 가 폐지됨으로써, NLP, CSS(Computational Social Science), 그리고 LLM 평가 연구 분야에서 자동 독성 측정을 위한 de facto 표준으로 기능해 왔던 것이 사라지게 되었습니다. 우리는 이 단일 전산 도구 위에 구축된 공동체의 구조적 의존성을 문서화하고, 이러한 의존성이 집단적인 연구 노력에 영향을 미쳤으며 (그리고 앞으로도 그럴 가능성이 높음) 어떤 인식론적 문제를 야기했는지 논의합니다. Perspective 의 모델은 버전 관리나 공개 없이 주기적으로 업데이트되었으며, 그 주석(annotation) 구조는 논쟁의 여지가 있는 개념에 대한 단일 기업의 운영적 정의(reflection)를 반영했고, 그 점수들은 동시에 평가 대상이자 평가 기준으로 사용되었습니다. 이 폐지는 업데이트 불가능한 벤치마크, 재현 불가능한 결과를 뒤로 남기고, 결국 이러한 문제를 고착화하기 위해 오픈 소스가 아닌 폐쇄형 LLM 으로 눈을 돌리게 될 위험에 처한 분야를 남겨둡니다. 우리는 Perspective 의 공식적인 종료 선언을 독립적이고 유효하며 적응 가능하고 재현 가능한 독성 및 혐오 표현 측정 인프라를 요구하는 기회로 삼고 있습니다. 본 논문에서 기술적 및 거버넌스 요건을 제시합니다.

Insights

Bye Bye Perspective API: NLP, CSS 및 LLM 평가의 측정 인프라에 대한 교훈

요약

핵심 포인트

댓글

운송 요금이 사상 최고치 근처를 유지함에 따라 화주들은 더 타이트해진 운송 용량(Capacity)에 직면하다

AI "이중 스파이": 생산성 열풍 뒤에 숨겨진 보안 위기

2026년 Unreal Engine을 위한 최고의 AI 모델은? Kimi K3 vs Claude Opus 5 vs Qwen3.8

시각적 대조 자기 증류 (Visual Contrastive Self-Distillation): 시각-언어 모델 (VLM) 학습의 단순화

운송 요금이 사상 최고치 근처를 유지함에 따라 화주들은 더 타이트해진 운송 용량(Capacity)에 직면하다

AI "이중 스파이": 생산성 열풍 뒤에 숨겨진 보안 위기

2026년 Unreal Engine을 위한 최고의 AI 모델은? Kimi K3 vs Claude Opus 5 vs Qwen3.8

시각적 대조 자기 증류 (Visual Contrastive Self-Distillation): 시각-언어 모델 (VLM) 학습의 단순화