연구 질문에서 과학 워크플로우까지: 과학 자동화를 위한 에이전트형 AI 활용
요약
기존의 과학 워크플로우 시스템은 실행(scheduling, resource management)을 자동화하지만, 연구 질문을 실제 워크플로우 사양으로 변환하는 '의미론적 번역' 단계는 여전히 수동 작업이었습니다. 본 논문은 이 격차를 해소하기 위해 에이전트 기반 아키텍처를 제안합니다. 이 시스템은 LLM이 자연어 연구 질문을 구조화된 의도(Intent)로 해석하고, 검증된 생성기가 재현 가능한 워크플로우 DAG를 만들며, 도메인 전문가가 'Skills'라는 지식 레이어를 제공하여 정확성을 극대화합니다. 실험 결과, Skills 도입
핵심 포인트
- 제안된 에이전트 아키텍처는 연구 질문을 구조적 의도로 해석하는 의미론적 계층(semantic layer)을 추가하여 과학 워크플로우 자동화를 완성했습니다.
- 도메인 지식을 담은 'Skills'를 활용했을 때, 초기 Intent 정확도가 44%에서 83%로 크게 향상되었습니다.
- 워크플로우 생성 과정에서 Skills 기반의 지연(deferred) 처리를 적용하여 데이터 전송량을 92%까지 줄였습니다.
- Kubernetes 환경에서 End-to-End 파이프라인을 구동했을 때, LLM 오버헤드가 15초 미만이며 쿼리당 비용은 $0.001 이하로 매우 효율적임을 입증했습니다.
연구 질문에서 과학 워크플로우까지: 과학 자동화를 위한 에이전트형 AI 활용
과학 워크플로우 시스템(Scientific workflow systems)은 스케줄링, 오류 허용성(fault tolerance), 리소스 관리 등 실행 자체는 자동화하지만, 그 선행 단계인 의미론적 번역(semantic translation)까지는 자동화하지 못합니다. 과학자들은 여전히 연구 질문을 워크플로우 사양(workflow specifications)으로 수동 변환해야 하며, 이 작업은 도메인 지식과 인프라 전문 지식을 모두 요구합니다.
본 논문에서는 세 가지 계층을 통해 이러한 격차를 해소하는 에이전트형 아키텍처(agentic architecture)를 제안합니다. 첫째, LLM이 자연어(natural language)를 구조화된 의도(structured intents)로 해석하는 의미론적 계층(semantic layer); 둘째, 검증된 생성기(validated generators)가 재현 가능한 워크플로우 DAG(Directed Acyclic Graph)를 생성하는 결정론적 계층(deterministic layer); 셋째, 도메인 전문가들이 어휘 매핑(vocabulary mappings), 파라미터 제약 조건(parameter constraints), 최적화 전략을 인코딩한 마크다운 문서 형태의 '스킬(Skills)'을 작성하는 지식 계층(knowledge layer)입니다. 이러한 분해(decomposition)를 통해 LLM의 비결정성(non-determinism)은 의도 추출에 국한됩니다: 동일한 의도는 항상 동일한 워크플로우를 산출합니다.
저희는 이 아키텍처를 1000 Genomes 인구 유전학 워크플로우와 Kubernetes 위에서 실행되는 Hyperflow WMS(Workflow Management System)에 구현하고 평가했습니다. 150개 질의에 대한 제거 연구(ablation study) 결과, '스킬'을 적용했을 때 의도 완전 일치 정확도(full-match intent accuracy)가 44%에서 83%로 향상되었습니다; 스킬 기반 지연 워크플로우 생성(skill-driven deferred workflow generation)은 데이터 전송량을 92% 줄였으며, 최종 종단 간 파이프라인(end-to-end pipeline)은 Kubernetes 위에서 LLM 오버헤드가 15초 미만이고 질의당 비용이 $0.001 미만으로 완료되었습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기