
HarnessX
요약
HarnessX는 실행 피드백을 통해 프롬프트, 도구, 메모리를 적응시키는 에이전트 하네스 파운드리입니다. MRAgent의 능동적 재구성 메모리 기술을 통해 장기 추론 능력을 향상시키고 토큰 비용을 절감합니다.
핵심 포인트
- 실행 피드백을 통한 프롬프트 및 도구의 적응형 진화
- ALFWorld, GAIA 등 주요 벤치마크에서 최대 44% 성능 향상
- Cue-Tag-Content 메모리 그래프를 통한 능동적 메모리 재구성
- 장기 추론 능력 23% 향상 및 토큰 비용 절감
HarnessX
자신의 흔적(traces)으로부터 진화하는 결합 가능한 에이전트 하네스(agent harnesses)를 위한 파운드리(foundry)입니다.
AEGIS는 실행 피드백(execution feedback)을 통해 프롬프트(prompts), 도구(tools), 그리고 메모리(memory)를 적응시킵니다.
이는 ALFWorld, GAIA, WebShop, 그리고 SWE-bench 전반에 걸쳐 최대 +44%의 성능 향상을 가져옵니다.
논문:
https://paperswithcode.co/paper/2606.142
49
...
전체 코드와 흔적(traces)은 향후 릴리스에서 오픈 소스로 공개될 예정입니다.
전체 파운드리를 기대해 주세요.
메모리는 검색(retrieved)되는 것이 아니라 재구성(reconstructed)됩니다.
MRAgent는 능동적 재구성(active reconstruction)을 사용하는 Cue-Tag-Content 메모리 그래프를 사용하여, LoCoMo 및 LongMemEval에서 토큰 비용을 절감하는 동시에 장기 추론(long-horizon reasoning) 능력을 최대 23% 향상시킵니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 X @huggingpapers (검증됨)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기