X요약2026. 06. 09. 01:04

MMAE: 대규모 멀티태스크 오디오 편집 벤치마크 (Massive Multitask Audio Editing Benchmark)

요약

지시어 기반 오디오 편집 성능을 측정하기 위한 최초의 포괄적인 벤치마크인 MMAE를 소개합니다. 7가지 모달리티와 다양한 복잡도 레벨을 포함하며, 현재 주요 모델들이 복잡한 작업에서 낮은 정확도를 보임을 입증했습니다.

지시어 기반 (instruction-based) 오디오 편집을 위한 최초의 포괄적인 테스트베드입니다.

7가지 모달리티 (modalities). 6가지 복잡도 레벨 (complexity levels). 2,000개의 샘플. 17,741개의 루브릭 (rubrics).

주요 모델들이 복잡한 작업에서 0%의 정확한 일치 (exact match)를 기록했습니다.

Hugging Face에서 전체 벤치마크를 확인해 보세요.

AI 자동 생성 콘텐츠