FARS: 대규모로 배포된 완전 자동화된 연구 시스템

최근의 자동화된 연구 시스템들은 언어 모델 (Language-model) 에이전트가 가설을 생성하고, 실험을 수행하며, 완전한 원고를 작성할 수 있음을 보여주었으나, 대부분의 증거는 여전히 선택된 사례, 인간이 설정한 주제, 또는 몇 가지 사전 정의된 연구 과제에서 비롯됩니다. 우리는 다양한 연구 주제에 걸쳐 대규모로 작동하도록 설계된 완전 자동화된 AI-for-AI 연구 시스템인 FARS (Fully Automated Research System)를 제시합니다. FARS는 제안서, 코드, 로그, 결과 및 원고를 기록하는 공유 워크스페이스를 통해 조정되는 단계별 에이전트들을 사용하여, 아이디어 구상 (Ideation), 계획 (Planning), 실험 (Experimentation), 그리고 작성 (Writing)을 통해 자율적으로 프로젝트를 생성하고 발전시킵니다. 첫 번째 공개 배포에서 FARS는 선별된 성공 사례가 아닌 감사 가능한 코퍼스 (Auditable corpus)로서 중간 산출물들을 보존하면서, 67개의 세분화된 AI/ML 주제에 걸쳐 166편의 완전한 연구 논문을 생성했습니다. 우리는 140편의 논문을 포함하여 전체 평점, 세부 점수, 무결성 검사 (Integrity checks), 그리고 LLM 사용 공개 (LLM-use disclosure)를 포함한 자원봉사 리뷰어들의 282개 구조화된 리뷰를 통해 이 코퍼스를 평가합니다. 리뷰 결과에 따르면, FARS는 대규모 공개 배포 환경에서 리뷰할 가치가 있고 때로는 강력한 AI/ML 연구 산출물을 생성할 수 있는 반면, 좁은 실험 범위, 방법론적 한계, 그리고 무결성 문제와 같은 반복적인 실패 모드 (Failure modes)도 드러내고 있습니다.

Insights

FARS: 대규모로 배포된 완전 자동화된 연구 시스템

요약

핵심 포인트

댓글

UPI의 AI 베팅: 결제 데이터가 화려한 모델보다 중요한 이유

AI에게 코드베이스를 설명하는 것을 멈추세요 — Cursor가 직접 읽게 하세요 (2026년 7월)

박제된 나비(Lepidoptera)의 실용적인 고충실도 신규 시점 합성 (Novel-View Synthesis)

NURBS Splatting: 벡터 그래픽을 위한 통합 미분 가능 렌더링 프레임워크

UPI의 AI 베팅: 결제 데이터가 화려한 모델보다 중요한 이유

AI에게 코드베이스를 설명하는 것을 멈추세요 — Cursor가 직접 읽게 하세요 (2026년 7월)

박제된 나비(Lepidoptera)의 실용적인 고충실도 신규 시점 합성 (Novel-View Synthesis)

NURBS Splatting: 벡터 그래픽을 위한 통합 미분 가능 렌더링 프레임워크