StarDrinks: 음료 주문 시나리오를 위한 영어 및 한국어 SLU 평가용 테스트 세트

LLM 과 음성 비서는 점점 더 많은 목적 지향적 상호작용에 사용되고 있지만, 그 평가는 종종 실제 사용자 요청의 다양성과 복잡성을 포착하지 못하는 통제된 시나리오에 의존합니다. 예를 들어, 음료 주문은 다양한 명칭 개체, 음료 종류, 사이즈, 커스터마이징 및 브랜드별 전문 용어를 포함할 뿐만 아니라, 주저함이나 자기 수정과 같은 자발적 화용 현상을 포함합니다. 이 격차를 해소하기 위해 우리는 StarDrinks 를 소개합니다. 이는 음성 발화 (speech utterances) 특징, 전사 (transcriptions), 그리고 주석 처리된 슬롯 (annotated slots) 을 포함하는 영어와 한국어 테스트 세트입니다. 우리의 데이터셋은 음성에서 슬롯으로의 SLU, 전사에서 슬롯으로의 NLU, 그리고 음성에서 전사로의 ASR 평가를 지원하여 언어적으로 풍부하고 실제적인 작업에서 모델의 견고성과 일반화를 위한 현실적인 벤치마크를 제공합니다.

Insights

StarDrinks: 음료 주문 시나리오를 위한 영어 및 한국어 SLU 평가용 테스트 세트

요약

핵심 포인트

댓글

Lip-Bu Tan 체제 하의 Intel 파운드리, 첫 외부 고객사 확보. 실적 발표 2일 전 주가 8% 이상 급등

Claude가 이제 어떤 웹사이트의 인터페이스도 직접 복제할 수 있습니다

AI를 상당히 사용하고 있음에도 AI 활용 설문에서는 낮은 점수였다──제2세대 AI 인재라는 생각

AI를 활용한 3D 게임 제작의 어려움을 해결해 주는 threejs-game-skills

Lip-Bu Tan 체제 하의 Intel 파운드리, 첫 외부 고객사 확보. 실적 발표 2일 전 주가 8% 이상 급등

Claude가 이제 어떤 웹사이트의 인터페이스도 직접 복제할 수 있습니다

AI를 상당히 사용하고 있음에도 AI 활용 설문에서는 낮은 점수였다──제2세대 AI 인재라는 생각

AI를 활용한 3D 게임 제작의 어려움을 해결해 주는 threejs-game-skills