X요약2026. 06. 24. 14:48

온디바이스(On-device)에서 AI Agent를 실행하는 경량 런타임: 앱이 제어 가능하고, 추적 가능하며, 복구 가능한 Agent를

요약

온디바이스 환경에서 제어, 추적, 복구가 가능한 경량 AI Agent 런타임을 소개합니다. ReAct 루프와 도구 스케줄링을 통해 모델 실행 단계를 검증하며, MiniCPM-V 4.6 모델을 기반으로 성능을 최적화했습니다.

핵심 포인트

온디바이스 최적화된 경량 런타임 제공
ReAct 루프 기반의 모델 호출 및 도구 스케줄링
세션 스냅샷 및 복구 기능을 통한 안정성 확보
MiniCPM-V 4.6 미세 조정을 통한 Agent 성능 대폭 향상

온디바이스(On-device)에서 AI Agent를 실행하는 경량 런타임(Lightweight Runtime)을 통해, 앱이 제어 가능하고(Controllable), 추적 가능하며(Traceable), 복구 가능한(Recoverable) Agent를 실행할 수 있게 합니다.

이 런타임은 ReAct 루프를 사용하여 모델을 호출하고, 실행 단계를 검증하며 도구(Tool)를 스케줄링합니다. 도구 레지스트리(Tool Registry), 온디맨드(On-demand) 스키마 로딩, 컨텍스트 예산 관리(Context Budget Management), 세션 스냅샷/복구(Session Snapshot/Recovery), 후크 가드레일(Hook Guardrails) 및 관측성(Observability) 기능이 내장되어 있습니다. 기반 모델은 MiniCPM-V 4.6이며, SFT + DPO 미세 조정(Fine-tuning)을 거친 후 Agent 작업의 pass@1 수치가 3/200에서 101/200으로 상승하였고, 도구 재현율(Tool Recall)은 5%에서 82%로 향상되었습니다.

AI 자동 생성 콘텐츠

원문 바로가기

온디바이스(On-device)에서 AI Agent를 실행하는 경량 런타임: 앱이 제어 가능하고, 추적 가능하며, 복구 가능한 Agent를

요약

핵심 포인트

댓글