본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 06. 02. 10:47

Ryze: 생물 의학 논문으로부터의 증거 강화 데이터 합성

요약

Ryze는 생물 의학 논문의 시각적 요소와 텍스트를 결합하여 증거가 강화된 학습 데이터를 자동으로 합성하는 시스템입니다. 이를 통해 구축된 BioVLM-8B 모델은 기존 모델 대비 높은 정확도를 기록하며 성능을 입증했습니다.

핵심 포인트

  • 생물 의학 논문의 그림, 표, 텍스트를 통합한 QA 쌍 자동 합성
  • 차트/표 인식 및 LLM 기반 정제를 통한 데이터 품질 향상
  • SFT와 강화 학습을 결합한 단계적 사후 학습 전략 적용
  • 200달러 미만의 저비용으로 고성능 BioVLM-8B 모델 생성
  • LAB-Bench에서 GPT-5.2를 상회하는 성능 달성

범용 VLM (Vision-Language Models)은 과학 논문 내의 유효한 답변이 그림(figures), 표(tables), 차트(charts), 캡션(captions) 및 참조 텍스트(referring text)에 분산된 증거에 의존하기 때문에 생물 의학 연구에서 여전히 신뢰하기 어렵습니다. 기존의 사후 학습 (post-training) 파이프라인은 비용이 많이 드는 전문가 주석 (expert annotation)과 이러한 증거 구조를 누락하는 합성 데이터 (synthetic data)로 인해 병목 현상을 겪고 있습니다. 우리는 원시 생물 의학 논문을 증거가 강화된 학습 세트와 도메인 특화 VLM으로 변환하는 완전 자동화 시스템인 Ryze를 제시합니다. Ryze는 완전한 지원 증거(시각적 요소, 캡션, 추출된 구조 및 참조 단락)를 포함하는 QA 쌍을 합성하고, 차트/표 인식 추출 및 LLM 기반 정제 (cleansing)를 통해 레이아웃 및 OCR 오류를 줄이며, 지도 미세 조정 (supervised fine-tuning)과 강화 학습 (reinforcement learning)을 결합한 단계적 사후 학습 전략을 적용합니다. Qwen3-VL-8B를 시작점으로 하여, Ryze는 200달러 미만의 비용으로 BioVLM-8B를 생성하며, LAB-Bench에서 48.0%의 가중 정확도 (weighted accuracy)를 달성하여 베이스 모델보다 +12.6%포인트 (pp) 높은 성능을 보였으며 GPT-5.2를 +3.8%포인트 (pp) 차이로 앞질렀습니다. 우리는 학습된 BioVLM-8B 모델과 함께 Ryze를 오픈 소스로 공개합니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0