본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 06. 25. 12:00

OncoSynth: 종양학에서의 치료 효과 추정을 위한 합성 데이터 생성

요약

OncoSynth는 종양학 분야에서 인과 관계를 보존하며 합성 데이터를 생성하는 머신러닝 프레임워크입니다. 확산 기반의 순차적 접근 방식을 통해 치료 효과 추정 시 발생하는 편향을 획기적으로 줄여줍니다.

핵심 포인트

  • 인과 관계를 인식하는 생성적 머신러닝 프레임워크 제안
  • 확산 기반 모델로 공변량, 치료, 결과 간의 관계 모델링
  • 기존 방식 대비 치료 효과 추정 오차를 최대 66% 감소
  • 데이터 접근이 제한된 환경에서 정밀 종양학 연구 지원

종양학(Oncology) 분야에서는 환자 수준의 데이터에 대한 접근이 제한되는 경우가 많습니다. 합성 데이터(Synthetic data)는 치료 효과를 분석하기 위한 대안을 제공하지만, 기존의 합성 데이터 생성 방식은 공변량(Covariates), 치료(Treatments), 결과(Outcomes) 사이의 인과 관계(Causal relationships)를 보존하지 못하며, 이로 인해 치료 효과의 편향된 추정(Biased estimates)을 초래합니다. 본 연구에서는 인구 집단 및 환자 수준의 치료 효과를 정확하게 추정할 수 있는 합성 코호트(Synthetic cohorts)를 생성하도록 설계된 생성적이고 인과 관계를 인식하는(Causally-aware) 머신러닝 프레임워크인 OncoSynth를 소개합니다. OncoSynth는 확산 기반의 순차적 접근 방식(Diffusion-based sequential approach)을 사용하여 공변량이 치료 할당(Treatment assignment)에 어떻게 영향을 미치는지, 그리고 치료가 생존(Survival)에 어떻게 영향을 미치는지 모델링합니다. 우리는 대규모 폐암(N = 37,128) 및 유방암(N = 17,046) 코호트를 사용하여 OncoSynth를 평가했습니다. 연구 결과, OncoSynth는 실제 환자, 치료 및 결과 분포를 보존하는 고충실도(High-fidelity) 합성 환자 코호트를 생성함을 보여주었습니다. 특히, OncoSynth는 인구 집단 수준의 치료 효과 오차를 최대 66%까지, 환자 수준의 치료 효과 오차를 최대 58%까지 줄임으로써 기존 방식보다 치료 효과 추정 성능을 향상시켰습니다. 이를 통해 OncoSynth는 데이터 공유가 제한된 환경에서 정밀 종양학(Precision oncology)을 위한 신뢰할 수 있는 증거 생성을 지원합니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0