AI가 제약 산업에서 연간 500억 달러를 절감하는 방법

제약 산업은 매년 연구 개발 (R&D)에 1,000억 달러 이상을 지출하지만, 평균적으로 신약 하나가 시장에 출시되기까지는 여전히 12~15년이 걸리며 26억 달러의 비용이 소요됩니다. 이 계산법은 수십 년 동안 깨지지 않았습니다. 하지만 지난 3년 동안, AI는 약물 개발 파이프라인 (drug development pipeline) 전체를 조용히 다시 써 내려가기 시작했습니다.

오늘 우리는 머신러닝 (machine learning)이 단순히 돈을 아끼는 것을 넘어, 시간과 생명을 구하고 있는 네 가지 구체적인 분야를 살펴보고자 합니다. 만약 당신이 다음 거대한 AI 애플리케이션 레이어 (application layer)가 어디인지 궁금해하는 개발자라면, 제약 산업이 그 답이 될 수도 있습니다.

아무도 말하지 않는 1,000억 달러 규모의 문제

신약 개발은 확률이 매우 낮은 숫자 게임입니다. 초기 발견 단계에서 스크리닝 (screening)된 10,000개의 화합물 중 약 하나만이 시장에 출시됩니다. 각각의 실패는 수백만 달러의 비용을 발생시키며, 이러한 실패는 복리로 쌓입니다. 임상 3상 (Phase III) 단계에서 실패한 약물은 이미 이전 단계에서 5억 달러 이상의 비용을 소진한 상태입니다.

가장 큰 병목 현상 (bottlenecks)은 다음과 같습니다:

타겟 식별 (Target identification): 어떤 단백질이나 경로를 약물화할지 결정하는 과정으로, 문헌 검토와 습식 실험 (wet-lab) 검증에 2~4년이 소요됩니다. 리드 최적화 (lead optimization)가 시작되기도 전에 타겟의 90%가 실패합니다.
리드 최적화 (Lead optimization): 화학적 히트 (chemical hit)를 약물 후보 물질로 정교화하는 과정으로, 수만 개의 화합물을 하나씩 합성하고 테스트해야 합니다.
임상 시험 (Clinical trials): 환자 모집에만 시험당 12~18개월이 걸릴 수 있으며, 시험 기관들은 정기적으로 등록 목표를 달성하지 못합니다.
규제 기관 제출 (Regulatory submission): FDA 서류를 편철하는 작업은 수동적이고 문서 집약적인 과정으로, 임상 시험이 완료된 후에도 12~18개월이 소요됩니다.

업계는 아웃소싱, CRO (임상시험수탁기관), 자동화를 시도해 왔습니다. 하지만 그 중 어느 것도 큰 변화를 만들어내지는 못했습니다. AI는 문제에 접근하는 층위(layer) 자체가 다르기 때문에 변화를 만들어냅니다. 즉, 무차별적인 실험 (brute-force experimentation)을 계산적 예측 (computational prediction)으로 대체합니다.

제약 산업 내 AI 혁신의 네 가지 기둥: 신약 개발 (drug discovery), 단백질 구조 예측 (protein folding), 진단 (diagnostics), 그리고 임상 시험 최적화 (clinical trials optimization).

AI가 신약 개발에서 실제로 작동하는 방식 (코드 포함)

이를 구체적인 사례를 통해 살펴보겠습니다. AI 기반 신약 개발 파이프라인 (pipeline)의 내부 구조는 다음과 같습니다.

1단계: 단백질 언어 모델을 이용한 타겟 식별 (Target Identification)

연구자들이 수년간 문헌 조사 (literature mining)에 시간을 허비하는 대신, 이제는 유전체 (genomic) 및 단백질체 (proteomic) 데이터베이스를 ESM-2 (Meta) 또는 ProtBERT와 같은 단백질 언어 모델 (protein language models)에 입력합니다. 이러한 모델들은 단백질을 벡터 공간 (vector spaces)에 임베딩 (embed)하며, 유사한 기능을 가진 것들이 서로 군집을 이루게 함으로써 타겟 식별을 최근접 이웃 탐색 (nearest-neighbor search) 문제로 변환합니다.

import torch
from transformers import AutoTokenizer, AutoModel

...

미지의 타겟과 알려진 약물 결합 가능 단백질 (druggable protein) 사이의 코사인 유사도 (cosine similarity)가 0.85 이상이라면, 다음 단계로 진행할 수 있는 강력한 신호로 간주합니다.

2단계: AlphaFold를 이용한 구조 예측 (Structure Prediction)

단백질 구조는 기능을 결정합니다. AlphaFold가 등장하기 전에는 단일 구조를 규명하는 데 12만 달러의 비용과 12개월의 X선 결정학 (X-ray crystallography) 과정이 필요했습니다. 이제는 비용이 들지 않으며 단 몇 시간 만에 완료됩니다.

# AlphaFold는 Google Colab 노트북을 통해 접근하거나
# AlphaFold 데이터베이스 API (2억 개 이상의 사전 계산된 구조)를 통해 사용할 수 있습니다.

...

AlphaFold 데이터베이스는 이제 알려진 거의 모든 단백질을 다루고 있으며, 전 세계 모든 연구자가 무료로 이용할 수 있습니다. 이는 다운스트림 애플리케이션 (downstream applications)을 가능하게 하는 근본적인 인프라의 변화입니다.

3단계: DiffDock을 이용한 분자 도킹 (Molecular Docking)

단백질 구조를 확보했다면, 이제 그에 결합하는 분자들을 찾아야 합니다. 전통적인 도킹 소프트웨어(AutoDock Vina, Schrodinger)는 수천 개의 포즈(poses)를 샘플링하고 점수를 매깁니다. MIT의 확산 모델(diffusion model)인 DiffDock은 분자 도킹을 생성 문제(generative problem)로 취급하며, PDBbind 벤치마크에서 94%의 top-1 정확도를 달성합니다.

# DiffDock은 pip install diffdock을 통해 사용할 수 있습니다.
# GPU에서 추론(inference)을 실행하며 신뢰도 점수와 함께 결합 포즈(binding poses)를 출력합니다.

...

과거 의약 화학자(medicinal chemists) 팀이 수개월 동안 합성 및 분석(assay) 작업을 수행해야 했던 일이 이제는 단일 GPU에서 몇 분 만에 실행됩니다.

임상 시험에서의 AI: 비용의 나머지 절반

신약 개발(Drug discovery)이 헤드라인을 장식하지만, 임상 시험은 약물당 26억 달러 예산의 60%를 차지합니다. AI는 여러 방향에서 이 수치를 절감하고 있습니다:

**환자 모집(Patient recruitment)**은 임상 지연의 가장 큰 원인입니다. 현재 NLP 모델은 전자 건강 기록(electronic health records)을 분석하여 환자를 임상 포함 기준(inclusion criteria)에 맞게 매칭함으로써 등록 시간을 40% 단축합니다. Mendel 및 Deep 6 AI와 같은 기업들은 이를 주요 병원 네트워크의 실제 운영 환경에 배치했습니다.

**합성 대조군(Synthetic control arms)**은 역사적 데이터(historical data)를 사용하여 위약(placebo) 그룹을 대체함으로써, 임상 시험당 필요한 환자 수를 줄입니다. FDA는 실제 세계 근거(real-world evidence)의 품질 임계값이 충족될 경우 합성 대조군을 유효한 것으로 인정하는 초안 지침을 발표했습니다.

**적응형 임상 설계(Adaptive trial designs)**는 임상 데이터가 들어옴에 따라 실시간으로 업데이트되는 베이지안 모델(Bayesian models)을 사용하여, 효능(efficacy) 또는 무용성(futility)을 근거로 임상을 조기에 종료할 수 있게 합니다. 이는 수학적으로는 간단하지만, AI 기반 데이터 파이프라인 없이는 운영상 불가능합니다. Moderna는 COVID 백신 개발 과정에서 이 접근 방식을 사용하여 10년의 과정을 11개월로 압축했습니다.

AI vs Traditional Drug Development Timeline

(https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.us-east-2.amazonaws.com%2Fuploads%2Farticles%2Fk9z4hft5m4cuqiu22fmt.png)
AI는 약물 개발 기간을 12~~15년에서 5~~7년으로 단축하며, 모든 단계에서 비용 절감을 실현합니다.

AI 진단: 의사보다 20% 더 정확함

2025년 1월, The Lancet Digital Health에 발표된 연구에 따르면, 5개의 AI 모델로 구성된 앙상블(Ensemble)이 유방 촬영술(Mammogram)에서 단독으로 작업하는 방사선 전문의보다 20% 더 높은 민감도(Sensitivity)로 유방암을 탐지했습니다. 위음성(False negatives) 비율은 9.4%에서 2.6%로 감소했습니다.

이는 단일 사례가 아닙니다. AI 진단 도구들은 다양한 양상(Modalities)에 걸쳐 초인적인 성능을 달성하고 있습니다:

양상 (Modality)	AI 정확도	인간 기준점 (Human Baseline)	개선 사항
흉부 X-선 (폐렴)	94.2%	82.1%	+12.1%
...

이러한 시스템은 의사를 대체하는 것이 아닙니다. 이들은 '제2의 판독자(Second reader)'로서 작동합니다. 즉, AI가 의심스러운 영역을 표시(Flag)하면, 방사선 전문의나 병리 전문의가 이를 검토하고 확정합니다. 그 결과 진단 누락이 줄어들고 소요 시간(Turnaround time)이 획기적으로 단축됩니다. 과거에는 방사선 전문의의 판독을 위해 4시간을 기다려야 했던 흉부 X-선이 이제는 몇 초 만에 긴급 검토 대상으로 분류됩니다.

개발자들에게 모델 아키텍처(Model architectures)는 접근 가능한 영역입니다. 대부분의 의료 영상 AI는 도메인 특화 데이터셋(Domain-specific datasets)으로 미세 조정(Fine-tuned)된 표준 비전 트랜스포머(Vision Transformers, ViT)를 기반으로 구축됩니다. 어려운 부분은 모델이 아니라, 규제 경로(Regulatory pathway)와 정제된 학습 데이터(Curated training data)입니다.

이것이 개발자들에게 의미하는 바

만약 당신이 AI/ML 분야에서 일하며 영향력이 큰 응용 분야를 찾고 있다면, 제약(Pharma) 산업은 시장 규모에 비해 엔지니어링 인재에 대한 투자가 부족한 상태입니다. 몇 가지 유망한 분야는 다음과 같습니다:

단백질 설계 도구 (Protein design tools). RosettaFold-All-Atom과 RFdiffusion은 오픈 소스이며 활발하게 유지 관리되고 있습니다. 이들을 둘러싼 툴링(Tooling)(시각화, 파이프라인 오케스트레이션, MLOps)은 NLP나 컴퓨터 비전(Computer vision) 분야에 존재하는 것들에 비하면 여전히 초기 단계(Primitive)입니다.

임상 시험 최적화 (Clinical trial optimization). 임상 시험 매칭 (Trial matching), 프로토콜 디지털화 (Protocol digitization), 그리고 실제 임상 근거 (RWE) 분석은 명확한 규제 프레임워크가 존재하면서도 아직 해결되지 않은 거대한 문제들입니다. 기업들은 환자 모집을 위해서만 사이트당 월 5만 달러에서 20만 달러를 지불하고 있으며, AI는 이를 입증 가능한 수준으로 개선할 수 있습니다.

규제 문서 자동화 (Regulatory document automation). FDA 제출 프로세스는 수천 페이지의 구조화된 문서를 생성합니다. 검색 증강 생성 (RAG) 기술을 갖춘 LLM은 이에 매우 적합하며, FDA는 제출 서류 내 AI 생성 구성 요소에 대해 개방적인 태도를 보여왔습니다.

유전체 파운데이션 모델 (Genomic foundation models). ESM-2, Evo 2, 그리고 Nucleotide Transformer는 공개적으로 사용 가능한 대규모 유전체 모델들입니다. 특정 질병이나 조직 유형에 맞춰 이 모델들을 미세 조정 (Fine-tuning)하는 것은 직접적인 임상 적용이 가능한 활발한 연구 분야입니다.

결론 (The Bottom Line)

제약 분야의 AI는 이론적인 약속이 아닙니다. AlphaFold는 2억 개의 단백질 구조를 계산했습니다. Insilico Medicine은 타겟 발굴부터 임상 2상(Phase II)까지 단 18개월과 260만 달러로 진행했습니다. AI 진단은 동료 검토 (Peer-reviewed) 연구를 통해 영상의학과 전문의보다 암을 더 일찍 발견하고 있습니다. 임상 시험 등록 기간은 40% 단축되고 있습니다.

제약 산업의 연간 1,000억 달러 규모의 R&D 예산은 CEO들이 밤잠을 설치게 만드는 숫자입니다. AI는 지난 50년 동안 이 숫자를 높이는 대신 실제로 낮출 수 있는 첫 번째 기술입니다. 문제는 이러한 변화가 일어날 것인가가 아니라, 얼마나 빨리 일어날 것인가와 누가 도구(Tooling)를 구축할 것인가입니다.

기술적 난제가 깊고, 데이터가 풍부하며, 투자 대비 효과 (ROI)가 인간의 생명으로 측정되는 AI 응용 분야를 찾고 있었다면, 제약 산업은 이미 비즈니스를 시작할 준비가 되어 있습니다.