arXiv논문2026. 04. 24. 21:38

연구 질문에서 과학 워크플로우까지: 과학 자동화를 위한 에이전트형 AI 활용

요약

기존의 과학 워크플로우 시스템은 실행(scheduling, resource management)을 자동화하지만, 연구 질문을 실제 워크플로우 사양으로 변환하는 '의미론적 번역' 단계는 여전히 수동 작업이었습니다. 본 논문은 이 격차를 해소하기 위해 에이전트 기반 아키텍처를 제안합니다. 이 시스템은 LLM이 자연어 연구 질문을 구조화된 의도(Intent)로 해석하고, 검증된 생성기가 재현 가능한 워크플로우 DAG를 만들며, 도메인 전문가가 'Skills'라는 지식 레이어를 제공하여 정확성을 극대화합니다. 실험 결과, Skills 도입

핵심 포인트

제안된 에이전트 아키텍처는 연구 질문을 구조적 의도로 해석하는 의미론적 계층(semantic layer)을 추가하여 과학 워크플로우 자동화를 완성했습니다.
도메인 지식을 담은 'Skills'를 활용했을 때, 초기 Intent 정확도가 44%에서 83%로 크게 향상되었습니다.
워크플로우 생성 과정에서 Skills 기반의 지연(deferred) 처리를 적용하여 데이터 전송량을 92%까지 줄였습니다.
Kubernetes 환경에서 End-to-End 파이프라인을 구동했을 때, LLM 오버헤드가 15초 미만이며 쿼리당 비용은 $0.001 이하로 매우 효율적임을 입증했습니다.

연구 질문에서 과학 워크플로우까지: 과학 자동화를 위한 에이전트형 AI 활용

과학 워크플로우 시스템(Scientific workflow systems)은 스케줄링, 오류 허용성(fault tolerance), 리소스 관리 등 실행 자체는 자동화하지만, 그 선행 단계인 의미론적 번역(semantic translation)까지는 자동화하지 못합니다. 과학자들은 여전히 연구 질문을 워크플로우 사양(workflow specifications)으로 수동 변환해야 하며, 이 작업은 도메인 지식과 인프라 전문 지식을 모두 요구합니다.

본 논문에서는 세 가지 계층을 통해 이러한 격차를 해소하는 에이전트형 아키텍처(agentic architecture)를 제안합니다. 첫째, LLM이 자연어(natural language)를 구조화된 의도(structured intents)로 해석하는 의미론적 계층(semantic layer); 둘째, 검증된 생성기(validated generators)가 재현 가능한 워크플로우 DAG(Directed Acyclic Graph)를 생성하는 결정론적 계층(deterministic layer); 셋째, 도메인 전문가들이 어휘 매핑(vocabulary mappings), 파라미터 제약 조건(parameter constraints), 최적화 전략을 인코딩한 마크다운 문서 형태의 '스킬(Skills)'을 작성하는 지식 계층(knowledge layer)입니다. 이러한 분해(decomposition)를 통해 LLM의 비결정성(non-determinism)은 의도 추출에 국한됩니다: 동일한 의도는 항상 동일한 워크플로우를 산출합니다.

저희는 이 아키텍처를 1000 Genomes 인구 유전학 워크플로우와 Kubernetes 위에서 실행되는 Hyperflow WMS(Workflow Management System)에 구현하고 평가했습니다. 150개 질의에 대한 제거 연구(ablation study) 결과, '스킬'을 적용했을 때 의도 완전 일치 정확도(full-match intent accuracy)가 44%에서 83%로 향상되었습니다; 스킬 기반 지연 워크플로우 생성(skill-driven deferred workflow generation)은 데이터 전송량을 92% 줄였으며, 최종 종단 간 파이프라인(end-to-end pipeline)은 Kubernetes 위에서 LLM 오버헤드가 15초 미만이고 질의당 비용이 $0.001 미만으로 완료되었습니다.

AI 자동 생성 콘텐츠

원문 바로가기

연구 질문에서 과학 워크플로우까지: 과학 자동화를 위한 에이전트형 AI 활용

요약

핵심 포인트

연구 질문에서 과학 워크플로우까지: 과학 자동화를 위한 에이전트형 AI 활용

댓글