이번 주 Hugging Face Daily Papers: 월드 모델(world models), 에이전트적 절제(agentic

이번 주 Hugging Face Daily Papers: 월드 모델(world models), 에이전트적 절제(agentic abstention), 그리고 컨테이너 없는 코드

Orca: The World is in Your Mind — 텍스트, 이미지, 그리고 체화된 행동(embodied action) 생성을 통합하기 위해 차상태 예측(Next-State-Prediction)을 사용하는 일반 월드 파운데이션 모델(general world foundation model)
Agentic Abstention — LLM 에이전트는 언제 행동을 멈춰야 하는지 알고 있을까요? 미세 조정(fine-tuning) 없이도 적시에 절제(abstention)를 개선하는 새로운 방법
Dockerless — 코딩 에이전트를 위한 환경 독립형 프로그램 검증기(environment-free program verifier)로, 컨테이너 없이 SWE-bench Verified에서 62%의 점수를 기록
Scaling the Horizon, Not the Parameters — 35B 에이전트가 장기적 스케일링(long-horizon scaling)을 통해 어떻게 조 단위 파라미터(trillion-parameter) 성능에 도달하는가
LiveEdit — 대화형 AR 앱을 위해 12.66 FPS로 실행되는 실시간 확산 기반(diffusion-based) 스트리밍 비디오 편집
Program-as-Weights — 퍼지 함수(fuzzy functions)를 50배 적은 메모리로 32B 모델 품질과 일치하는 작은 신경 아티팩트(neural artifacts)로 컴파일
BlockPilot — 확산 모델(diffusion models)을 위한 인스턴스 적응형 투기적 디코딩(instance-adaptive speculative decoding)으로 4.2배의 속도 향상 달성
DOPD — 학생-교사 지식 전이(student-teacher knowledge transfer) 과정에서 특권 환상(privilege illusion)을 해결하는 이중 온폴리시 증류(Dual On-policy Distillation)
Does VLA Even Know the Basics? — VLM이 체화된 에이전트(embodied agents)가 될 때 상식과 세상에 대한 지식(world knowledge)을 얼마나 상실하는지 측정
Formalizing Latent Thoughts — LLM의 잠재 표현(latent representations)이 우리가 가정하는 것보다 훨씬 적은 추론을 인코딩할 수 있음을 보여주는 네 가지 공리(axioms)

Insights

이번 주 Hugging Face Daily Papers: 월드 모델(world models), 에이전트적 절제(agentic

요약

핵심 포인트

댓글

MCP를 활용한 첫 번째 AI 에이전트 구축: 단계별 가이드

에이전트 설계는 지능이 아니라 제한된 최적화이다

코딩 없이 25분 만에 AI 에이전트 만들기

오늘의 주식 시장: 기록적인 한 주 이후 S&P 500, Nasdaq, Dow 선물 상승

MCP를 활용한 첫 번째 AI 에이전트 구축: 단계별 가이드

에이전트 설계는 지능이 아니라 제한된 최적화이다

코딩 없이 25분 만에 AI 에이전트 만들기

오늘의 주식 시장: 기록적인 한 주 이후 S&P 500, Nasdaq, Dow 선물 상승