본문으로 건너뛰기

© 2026 Molayo

X요약2026. 05. 29. 22:51

AgentDoG 1.5

요약

AgentDoG 1.5는 AI 에이전트의 안전성을 위한 경량화 및 확장 가능한 정렬 프레임워크입니다. 단 1k개의 샘플만으로도 소규모 모델이 선도적인 폐쇄형 시스템과 대등한 성능을 내며, BeliefTrack을 통해 추론 실패를 70% 이상 줄였습니다.

핵심 포인트

  • 0.8B~8B 규모 모델로 고성능 정렬 달성
  • 단 1k개의 샘플만으로 학습 가능한 효율성
  • BeliefTrack을 통한 문맥적 신념 관리 최적화
  • 장기 추론 실패율 70% 이상 감소
  • 모든 체크포인트 공개 배포

AI 에이전트 안전성 (safety)을 위한 경량화 및 확장 가능한 정렬 (alignment) 프레임워크입니다.
0.8B에서 8B 파라미터 규모의 모델들이 단 ~1k개의 샘플만으로 학습되었음에도 불구하고, GPT-5.4와 같은 선도적인 폐쇄형 (closed-source) 시스템과 대등한 성능을 보여줍니다.
모든 체크포인트 (checkpoints)는 공개적으로 배포됩니다.

논문 (Paper):
https://huggingface.co/papers/2605.29801

전체 모델 컬렉션 탐색:
https://huggingface.co/collections/AI45Research/agentdog15

LLM (Large Language Models)은 언제 정보를 업데이트하거나, 보존하거나, 혹은 무시해야 할까요?

문맥적 신념 관리 (Contextual Belief Management)는 장기 추론 (long-horizon reasoning)에 부족했던 요소였습니다. 우리는 BeliefTrack을 소개하며, 신념 상태 (belief states)를 최적화함으로써 추론 실패를 70% 이상 줄일 수 있음을 보여줍니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 X @huggingpapers (검증됨)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0