재귀적 에이전트 시스템 구축

재귀적 에이전트 시스템 구축
= 에이전트 수천 명을 조직처럼 운용해서 모델 훈련을 대규모/자동화하는 인프라

Cursor의 Composer는 정말이지 훌륭한데, 다음 버전을 훈련하기 위해 수천 개의 에이전트를 대규모로 운용하는 시스템에 대한 얘기입니다.

에이전트 조직은..

구조는 어디서든 접근할 수 있는 방식이니 참고할 수 있어요.

Fleet Manager.. 이 메인 에이전트는 대형 원격 머신에서 상시 실행되면서, 디스크 파일 형태의 inbox로 상태관리가 됩니다.

그리고 수백 대의 자식 에이전트가 있는 머신에 SSH로 접속해 상태 수집.

루프마다 fleet health 체크하면서 → 정상 작업은 백그라운드에서 계속 유지 → 문제가 있는 작업은 팀 Slack으로 즉시 알림 → 필요시 프로세스 종료/재시작 등 직접 제어 👌🏻

ML 실험 운영, 결과 리뷰/모니터링을 스킬로 제공하는게 재미있군요?

연구자 시간은 가장 귀한 자원 ㅇㅇ 인간 관리자가 1만 명을 직접 관리하는 것은 사실상 불가능.

그치만 에이전트 조직으로는 가능하다는 것.

Insights