Mistral, Leanstral-1.5-119B-A6B 출시

6B의 활성 파라미터 (active parameters)를 가진 Apache-2.0 라이선스의 무료 모델인 Leanstral 1.5는 형식 검증 (formal verification) 분야에서 대폭적인 성능 향상을 제공합니다. 이 모델은 miniF2F를 포화시키고, PutnamBench 문제 중 587/672개를 해결하며, FATE-H (87%) 및 FATE-X (34%)에서 최첨단 (state-of-the-art) 결과를 달성했습니다. 미드 트레이닝 (mid-training), 지도 미세 조정 (supervised fine-tuning), 그리고 CISPO를 활용한 강화학습 (reinforcement learning)을 통해 학습되었으며, 에이전트 기반 증명 엔지니어링 (agentic proof engineering) 및 실제 코드 검증 (real-world code verification)에서 탁월한 성능을 보이며 테스트된 57개 저장소(repositories)에서 이전에 알려지지 않았던 5개의 버그를 발견했습니다.

Leanstral 1.5는 자동 정리 증명 (automated theorem proving) 및 형식 증명 엔지니어링 (formal proof engineering)에 사용될 수 있으며, 이를 통해 개발자는 소프트웨어와 코드 명세 (code specifications)의 정확성을 검증할 수 있습니다.
블로그: https://mistral.ai/news/leanstral-1-5/
벤치마크는 댓글 참조
submitted by /u/Tall-Ad-7742 to r/LocalLLaMA
[link] [comments]

Insights

Mistral, Leanstral-1.5-119B-A6B 출시

요약

핵심 포인트

댓글

반도체 주식 하락세 지속에 나스닥 선물 하락, 미국 고용 보고서에 주목

HSBC가 Adobe의 주식을 상향 조정하며 AI 우려가 과장되었다고 밝힌 후 Adobe 주가 상승 (ADBE)

Nvidia, AI 스타트업의 컴퓨팅 파워 접근을 돕기 위한 수익 공유 모델 출시 (NVDA)

Amex, 보상 혜택을 위해 Apple과 협력

반도체 주식 하락세 지속에 나스닥 선물 하락, 미국 고용 보고서에 주목

HSBC가 Adobe의 주식을 상향 조정하며 AI 우려가 과장되었다고 밝힌 후 Adobe 주가 상승 (ADBE)

Nvidia, AI 스타트업의 컴퓨팅 파워 접근을 돕기 위한 수익 공유 모델 출시 (NVDA)

Amex, 보상 혜택을 위해 Apple과 협력