StereoTales: LLM의 개방형 스테레오타입 발견을 위한 다국어 프레임워크

개방형 LLM 생성에서 사회적 편향에 대한 다국어 연구는 여전히 제한적입니다. 기존 벤치마크 대부분은 영어 중심이거나, 템플릿 기반이거나, 사전에 지정된 스테레오타입 인식에 국한되어 있습니다. 우리는 개방형 LLM 생성에서 사회적 편향의 출현을 체계적으로 연구하기 위한 다국어 데이터셋이자 평가 파이프라인인 StereoTales를 소개합니다. 이 데이터셋은 10개 언어와 79가지 사회-인구통학적 속성을 다루며, 23개의 최신 LLM이 생성한 65만 개 이상의 이야기를 포함하고 있으며, 각 이야기는 주인공의 사회-인구통학적 프로필을 19개 차원에 걸쳐 주석 처리했습니다. 이를 통해 우리는 통계적 테스트를 적용하여 1,500개가 넘는 과도하게 표현된 연관 관계를 식별했으며, 이후 이들을 평가하기 위해 패널(pane) 양쪽에서...

추가 분석을 지원하기 위해 모델 생성물, 속성 주석 및 유해성 평가를 포함하는 평가 코드와 데이터셋을 공개합니다.

Insights

StereoTales: LLM의 개방형 스테레오타입 발견을 위한 다국어 프레임워크

요약

핵심 포인트

댓글

요청에서 도구 하나를 제거해 보세요: 어떤 GPT-5 버전은 76%를 캐싱에 유지하지만, 다른 버전은 아무것도 유지하지 못합니다

나스닥, Tesla와 Alphabet 실적 발표를 앞두고 하락 마감

Justif - 웹을 위한 Knuth-Plass 양쪽 정렬과 마이크로타이포그래피

프로그래밍 잡기 2026년 7월 24일

요청에서 도구 하나를 제거해 보세요: 어떤 GPT-5 버전은 76%를 캐싱에 유지하지만, 다른 버전은 아무것도 유지하지 못합니다

나스닥, Tesla와 Alphabet 실적 발표를 앞두고 하락 마감

Justif - 웹을 위한 Knuth-Plass 양쪽 정렬과 마이크로타이포그래피

프로그래밍 잡기 2026년 7월 24일