마이크로소프트, 허깅페이스에서 DELULU 벤치마크 공개
요약
마이크로소프트가 허깅페이스 플랫폼에 DELULU 벤치마크를 공개했습니다. 이 벤치마크는 특히 코드 완성(code completion) 작업 중 '빈칸 채우기(fill-in-the-middle)' 시나리오를 평가하기 위해 설계된 새로운 평가 세트입니다.
핵심 포인트
- 마이크로소프트가 DELULU 벤치마크를 출시했다.
- DELULU는 코드 완성 작업을 위한 새로운 평가 도구이다.
- 이 벤치마크는 특히 '빈칸 채우기(fill-in-the-middle)' 형태의 코딩 능력을 측정하는 데 초점을 맞춘다.
마이크로소프트가 허깅페이스 (Hugging Face) 에서 DELULU 벤치마크를 출시했습니다.
fill-in-the-middle 코드 완성 작업 (fill-in-the-middle code completion tasks) 을 위한 새로운 평가套件입니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 X @_akhaliq (AI 논문)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기