X요약2026. 06. 09. 19:10

Bayesian-Agent: Skills를 가설로 다루는 LLM 에이전트의 자가 진화 레이어

요약

Bayesian-Agent는 Skills를 완전한 사후 확률 가설로 취급하여 LLM 에이전트의 자가 진화 레이어를 제공합니다. 이 시스템은 증거 기반으로 Skills를 수리, 분할 또는 폐기하며, DeepSeek v4와 결합하여 SOP-Bench 및 Lifelong AgentBench 점수를 크게 향상시켰습니다.

핵심 포인트

Skills를 사후 확률 가설로 다루는 에이전트 레이어
증거 기반으로 Skills의 수리/분할/폐기 수행
DeepSeek v4와 결합하여 벤치마크 성능 극대화

Bayesian-Agent

Skills를 완전한 사후 확률(posterior beliefs)을 가진 가설처럼 취급하는, LLM 에이전트를 위한 자체 진화 레이어입니다.

증거에 기반하여 Skills를 수리하거나, 분할하거나, 또는 폐기합니다. DeepSeek v4와 함께 SOP-Bench 점수를 80%에서 95%로, Lifelong AgentBench 점수를 100%까지 끌어올렸습니다.

Paper:
https://paperswithcode.co/paper/2606.083
48
…
Code:
https://github.com/DataArcTech/Bayesian-Agent
…

OmniGameArena은 VLM 게임 에이전트를 위한 실시간 UE5 벤치마크입니다.

12개의 새로운 게임이 단일 공유 인터페이스를 통해 솔로, PvP, 협동(Coop)을 아우릅니다.

개선 동역학 곡선(Improvement Dynamics Curve)은 에이전트가 반성 라운드를 거치며 어떻게 학습하고 개선되는지를 추적합니다.

AI 자동 생성 콘텐츠

원문 바로가기

Bayesian-Agent: Skills를 가설로 다루는 LLM 에이전트의 자가 진화 레이어

요약

핵심 포인트

댓글