
AgentDoG 1.5
요약
AgentDoG 1.5는 AI 에이전트의 안전성을 위한 경량화 및 확장 가능한 정렬 프레임워크입니다. 단 1k개의 샘플만으로도 소규모 모델이 선도적인 폐쇄형 시스템과 대등한 성능을 내며, BeliefTrack을 통해 추론 실패를 70% 이상 줄였습니다.
핵심 포인트
- 0.8B~8B 규모 모델로 고성능 정렬 달성
- 단 1k개의 샘플만으로 학습 가능한 효율성
- BeliefTrack을 통한 문맥적 신념 관리 최적화
- 장기 추론 실패율 70% 이상 감소
- 모든 체크포인트 공개 배포
AI 에이전트 안전성 (safety)을 위한 경량화 및 확장 가능한 정렬 (alignment) 프레임워크입니다.
0.8B에서 8B 파라미터 규모의 모델들이 단 ~1k개의 샘플만으로 학습되었음에도 불구하고, GPT-5.4와 같은 선도적인 폐쇄형 (closed-source) 시스템과 대등한 성능을 보여줍니다.
모든 체크포인트 (checkpoints)는 공개적으로 배포됩니다.
논문 (Paper):
https://huggingface.co/papers/2605.29801
전체 모델 컬렉션 탐색:
https://huggingface.co/collections/AI45Research/agentdog15
LLM (Large Language Models)은 언제 정보를 업데이트하거나, 보존하거나, 혹은 무시해야 할까요?
문맥적 신념 관리 (Contextual Belief Management)는 장기 추론 (long-horizon reasoning)에 부족했던 요소였습니다. 우리는 BeliefTrack을 소개하며, 신념 상태 (belief states)를 최적화함으로써 추론 실패를 70% 이상 줄일 수 있음을 보여줍니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 X @huggingpapers (검증됨)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기