
이번 주 Hugging Face Daily Papers: 월드 모델(world models), 에이전트적 절제(agentic
요약
Hugging Face의 이번 주 주요 논문들을 소개합니다. 월드 모델, 에이전트의 절제 능력, 컨테이너 없는 코드 검증 등 최신 AI 연구 트렌드를 다룹니다.
핵심 포인트
- Orca: 차상태 예측을 활용한 일반 월드 파운데이션 모델 연구
- Agentic Abstention: LLM 에이전트의 적절한 행동 중단 방법론
- Dockerless: 컨테이너 없이 SWE-bench에서 높은 성능을 내는 검증기
- Scaling the Horizon: 장기적 스케일링을 통한 에이전트 성능 향상
이번 주 Hugging Face Daily Papers: 월드 모델(world models), 에이전트적 절제(agentic abstention), 그리고 컨테이너 없는 코드
- Orca: The World is in Your Mind — 텍스트, 이미지, 그리고 체화된 행동(embodied action) 생성을 통합하기 위해 차상태 예측(Next-State-Prediction)을 사용하는 일반 월드 파운데이션 모델(general world foundation model)
- Agentic Abstention — LLM 에이전트는 언제 행동을 멈춰야 하는지 알고 있을까요? 미세 조정(fine-tuning) 없이도 적시에 절제(abstention)를 개선하는 새로운 방법
- Dockerless — 코딩 에이전트를 위한 환경 독립형 프로그램 검증기(environment-free program verifier)로, 컨테이너 없이 SWE-bench Verified에서 62%의 점수를 기록
- Scaling the Horizon, Not the Parameters — 35B 에이전트가 장기적 스케일링(long-horizon scaling)을 통해 어떻게 조 단위 파라미터(trillion-parameter) 성능에 도달하는가
- LiveEdit — 대화형 AR 앱을 위해 12.66 FPS로 실행되는 실시간 확산 기반(diffusion-based) 스트리밍 비디오 편집
- Program-as-Weights — 퍼지 함수(fuzzy functions)를 50배 적은 메모리로 32B 모델 품질과 일치하는 작은 신경 아티팩트(neural artifacts)로 컴파일
- BlockPilot — 확산 모델(diffusion models)을 위한 인스턴스 적응형 투기적 디코딩(instance-adaptive speculative decoding)으로 4.2배의 속도 향상 달성
- DOPD — 학생-교사 지식 전이(student-teacher knowledge transfer) 과정에서 특권 환상(privilege illusion)을 해결하는 이중 온폴리시 증류(Dual On-policy Distillation)
- Does VLA Even Know the Basics? — VLM이 체화된 에이전트(embodied agents)가 될 때 상식과 세상에 대한 지식(world knowledge)을 얼마나 상실하는지 측정
- Formalizing Latent Thoughts — LLM의 잠재 표현(latent representations)이 우리가 가정하는 것보다 훨씬 적은 추론을 인코딩할 수 있음을 보여주는 네 가지 공리(axioms)
AI 자동 생성 콘텐츠
본 콘텐츠는 X @huggingpapers (검증됨)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기