AgentDoG 1.5

AI 에이전트 안전성 (safety)을 위한 경량화 및 확장 가능한 정렬 (alignment) 프레임워크입니다.
0.8B에서 8B 파라미터 규모의 모델들이 단 ~1k개의 샘플만으로 학습되었음에도 불구하고, GPT-5.4와 같은 선도적인 폐쇄형 (closed-source) 시스템과 대등한 성능을 보여줍니다.
모든 체크포인트 (checkpoints)는 공개적으로 배포됩니다.

논문 (Paper):
https://huggingface.co/papers/2605.29801

전체 모델 컬렉션 탐색:
https://huggingface.co/collections/AI45Research/agentdog15

LLM (Large Language Models)은 언제 정보를 업데이트하거나, 보존하거나, 혹은 무시해야 할까요?

문맥적 신념 관리 (Contextual Belief Management)는 장기 추론 (long-horizon reasoning)에 부족했던 요소였습니다. 우리는 BeliefTrack을 소개하며, 신념 상태 (belief states)를 최적화함으로써 추론 실패를 70% 이상 줄일 수 있음을 보여줍니다.

Insights

AgentDoG 1.5

요약

핵심 포인트

댓글

GPT-5.6 Sol과 Claude Fable 5, 마인크래프트 클론 생성 테스트 결과 비교

맨땅부터 구축하는 것과는 반대되는 아이디어로 명성을 쌓은 Ivan Nardini:

대형 리포지토리를 AI에 접하게 하는 사람, 이거 상당히 궁금합니다👀

GPT-5.6 Sol과 Claude Fable 5, 마인크래프트 클론 생성 테스트 결과 비교

맨땅부터 구축하는 것과는 반대되는 아이디어로 명성을 쌓은 Ivan Nardini:

대형 리포지토리를 AI에 접하게 하는 사람, 이거 상당히 궁금합니다👀