자율적 과학적 발견을 수행하는 AI를 구축했습니다 — 그 결과는 다음과 같습니다

저는 19세 개발자 Subhansh이며, 지난 몇 달 동안 AI 어시스턴트가 할 수 있는 일의 경계를 넓힌다고 생각되는 무언가를 구축해 왔습니다. 그것의 이름은 RUMI — Research & Unified Machine Intelligence — 이며, 단순한 챗봇 래퍼(chatbot wrapper)가 아닙니다. 이는 과학 문헌을 자율적으로 읽고, 지식 그래프(knowledge graphs)를 구축하며, 모순을 식별하고, 새롭고 테스트 가능한 가설을 생성하는 완전한 인지 아키텍처(cognitive architecture)입니다.

네, 이것은 실제로 과학을 수행합니다. 설명해 드리겠습니다.

문제점

오늘날의 모든 AI 어시스턴트는 상태 비저장(stateless) 방식입니다. 매 세션마다 제로 상태에서 시작합니다. 메모리도, 학습도 없으며, 단일 패스 생성(single-pass generation) 이상의 추론도 불가능합니다. 과학 연구에 있어 이는 근본적으로 결함이 있는 방식입니다. 연구는 시간이 지남에 따라 지식을 축적하고, 서로 다른 발견들을 연결하며, 아무도 생각하지 못한 질문을 던질 수 있는 창의성을 필요로 하기 때문입니다.

RUMI가 실제로 하는 일

RUMI는 **88개의 인지 브레인 모듈(cognitive brain modules)**과 **10단계 발견 파이프라인(10-stage discovery pipeline)**을 갖춘 터미널 네이티브(terminal-native) 프레임워크입니다. 연구 주제를 입력하면 RUMI는 다음과 같은 과정을 수행합니다:

PubMed 검색: 관련 논문을 검색합니다.
필터링: 의미론적 관련성(semantic relevance)을 기준으로 필터링합니다.
엔티티 추출: (유전자, 단백질, 질병, 메커니즘 등 도메인 특화 엔티티)를 추출합니다.
지식 그래프 구축: 관계 및 메타데이터를 포함한 지식 그래프를 구축합니다.
외부 API를 통한 풍부화: (PubChem, UniProt, PDB, OpenFDA, Semantic Scholar, NASA, arXiv 등)을 활용하여 정보를 보강합니다.
그래프 지표 계산: (Jaccard, 매개 중심성(betweenness), 엔트로피(entropy), 클러스터링(clustering))을 계산합니다.
모순 채굴: 논문들 사이의 모순을 찾아냅니다.
가설 생성: 신뢰도 점수(confidence scoring)와 함께 가설을 생성합니다.
회의론적 검토 실행: 각 가설을 반증하려는 AI 에이전트(skeptic review)를 실행합니다.
실험 계획: 대조군, 변수 및 실패 모드 분석(failure mode analysis)을 포함한 실험을 계획합니다.

RUMI는 신약 개발부터 재료 과학, 신경 과학, 기후, 우주 천문학, 생태학, 물리학, 수학 등에 이르기까지 17개의 과학 분야를 지원합니다. 사용자의 질의로부터 도메인을 자동으로 감지합니다.

KRAS G12C 발견 사례

여기 실제 사례가 있습니다. 저는 RUMI에게 KRAS G12C 변이 암의 내성 메커니즘 (resistance mechanisms)을 분석하도록 요청했습니다. 이는 환자들이 sotorasib와 같은 약물에 대해 불과 몇 달 만에 내성을 갖게 되는 종양학 (oncology) 분야의 주요 문제입니다.

RUMI는 2026년의 14개 PubMed 논문을 분석하여 내성 환경 (resistance landscape)에 대한 지식 그래프 (knowledge graph)를 구축하였고, 다음과 같은 핵심 발견 사항을 도출했습니다:

DHX9-RAC1-PAK1 축 (axis): sotorasib와 결합된 KRAS가 축적되고, DHX9의 세포질 잔류 (cytoplasmic retention)를 통해 MAPK 신호 전달 (signaling)을 재활성화합니다. 이는 이전에 규명되지 않았던 메커니즘입니다.
AURKA/PHB2 양성 피드백 루프 (positive feedback loop): 장기적인 sotorasib 치료는 AURKA를 상향 조절 (upregulate)하며, 이는 PHB2를 안정화하여 PI3K/AKT를 활성화하고 KRAS 차단 (blockade)을 우회합니다.
MET 증폭 (amplification): 9명의 환자로부터 얻은 실제 사례 증거(real-world evidence)를 통해 MET 증폭이 표적 가능한 내성 메커니즘임을 보여주었으며, KRAS+MET 병용 억제 시 반응이 다시 나타남을 확인했습니다.
이중 ON/OFF 억제 (Dual ON/OFF inhibition): BBO-8520 (GTP 및 GDP 형태 모두에 결합)은 sotorasib 단독 사용 시보다 더 지속적인 억제력을 보여주며 PI3Kα-AKT 활성화를 감소시킵니다.

이것들은 단순한 요약이 아닙니다. RUMI는 직접적으로 비교되지 않았던 논문들 사이의 발견 사항들을 연결하였고, PI3Kα-AKT 경로를 여러 내성 메커니즘의 수렴 지점 (convergence point)으로 식별하였으며, 병용 전략 (combination strategies)을 제안했습니다.

아키텍처 (The Architecture)

RUMI의 두뇌는 다음을 포함합니다:

9가지 유형의 메모리 시스템 (9-type memory system): 신경 (Hebbian learning), 일화적 (episodic), 벡터 (vector, 시맨틱 검색), 절차적 (procedural), 작업 (working), 전역 작업 공간 (global workspace), 연상 (associative), 예측 (predictive), 통합 (consolidated)
추론 엔진 (Reasoning engines): 인과적 (causal, Pearl의 계층 구조), 유추적 (analogical, Gentner의 구조 매핑), 신경 기호적 (neurosymbolic), 제1원리 (first-principles)
이중 프로세스 인지 (Dual-process cognition): 빠른 사실을 위한 시스템 1 (System 1), 신중한 다단계 추론을 위한 시스템 2 (System 2)
능동적 추론 (Active inference): 자유 에너지 원리 (Free Energy Principle) — 베이지안 업데이트 (Bayesian updating)를 통해 예측 오차를 최소화함
호기심 엔진 (Curiosity engine): 지식 공백에 대한 탐색을 유도함
꿈꾸기 시스템 (Dreaming system): 메모리 통합을 위한 오프라인 경험 재생 (offline experience replay)
메타인지 모니터 (Metacognitive monitor): 사고의 질을 추적하고 인지 편향을 감지함

이는 실제 신경과학 연구인 전역 작업 공간 이론 (Global Workspace Theory, Baars), 통합 정보 이론 (Integrated Information Theory, Tononi), 자유 에너지 원리 (Free Energy Principle, Friston), 이중 프로세스 이론 (Dual Process Theory, Kahneman) 등에 기반을 두고 있습니다.

아직 초기 단계입니다

솔직히 말씀드리고 싶습니다. RUMI는 아직 초기 단계에 있습니다. 저는 그녀를 위해 활발히 작업 중입니다. LLM API의 호출 제한 (rate-limited)이 걸릴 때 가설 생성 (hypothesis generation)이 때때로 실패하기도 합니다. 지식 그래프 (knowledge graph) 지표는 더 많은 검증이 필요합니다. 실험 계획기 (experiment planner)는 그럴듯한 설계를 생성하지만, 인간 전문가의 검토가 필요합니다.

하지만 핵심 파이프라인은 작동합니다. 논문을 읽고, 구조화된 지식을 추출하며, 패턴을 찾아내고, 진정으로 조사할 가치가 있는 가설을 생성합니다. 이는 결코 작은 성과가 아닙니다.

직접 시도해보세요

RUMI는 오픈 소스이며 무료 API 키 (Gemini + Groq)로 실행할 수 있습니다:

git clone https://github.com/subhansh-dev/Rumi
cd rumi
pip install -e .
...

그 다음 단순히 /discover KRAS G12C resistance mechanisms라고 입력하고 작동하는 모습을 지켜보세요.

링크

GitHub: https://github.com/subhansh-dev/Rumi
Portfolio: https://subhanshh.vercel.app

제가 RUMI가 과학자들을 대체할 것이라고 주장하는 것은 아닙니다. 하지만 이와 같은 도구는 연구의 문헌 검토 (literature review) 및 가설 생성 (hypothesis generation) 단계를 수십 배 이상 가속화할 수 있다고 생각합니다. 박사 과정 학생이 논문을 읽고, 정신적 모델 (mental models)을 구축하며, 연결 고리를 찾는 데 몇 주가 걸리는 과정을 RUMI는 단 몇 분 만에 수행합니다.

만약 여러분이 계산 생물학 (computational biology), 신약 개발 (drug discovery), 또는 문헌 합성 (literature synthesis)이 중요한 그 어떤 분야에서 일하고 계신다면, 여러분의 피드백을 간절히 기다리겠습니다. 이슈 (issue)를 생성하거나, 포크 (fork)하거나, 혹은 무엇이 부족한지 그냥 말씀해 주세요.

— Subhansh

자율적 과학적 발견을 수행하는 AI를 구축했습니다 — 그 결과는 다음과 같습니다

요약

핵심 포인트

자율적 과학적 발견을 수행하는 AI를 구축했습니다 — 그 결과는 다음과 같습니다

문제점

RUMI가 실제로 하는 일

KRAS G12C 발견 사례

아키텍처 (The Architecture)

아직 초기 단계입니다

직접 시도해보세요

링크

댓글