Launch HN: Tamarind Bio (YC W24) – 신약 개발을 위한 AI 추론 (Inference) 제공업체
요약
Tamarind Bio는 AlphaFold와 같은 오픈 소스 모델을 활용하여 신약 개발을 위한 AI 추론(Inference) 서비스를 제공하는 플랫폼입니다. 기술적 배경이 없는 과학자들도 대규모 분자 AI 도구를 쉽게 사용할 수 있도록 웹 앱과 프로그래밍 인터페이스를 모두 지원하며, GPU 인프라 관리 부담을 줄여줍니다.
핵심 포인트
- AlphaFold 등 오픈 소스 모델 라이브러리를 활용한 AI 신약 개발 추론 플랫폼 제공
- 비기술직 과학자를 위한 웹 앱과 개발자를 위한 프로그래밍 인터페이스 동시 지원
- GPU 인프라 및 Docker 컨테이너 관리 부담을 제거하여 R&D 효율성 극대화
- 커스텀 스케줄러와 큐를 통해 CPU/GPU 작업 분할 및 수평적 확장 최적화
- 모델 파이프라인 연결, 미세 조정(fine-tuning), 습식 실험실 데이터 연결 기능 확장
안녕하세요 HN, 저희는 Tamarind Bio (https://www.tamarind.bio)의 Deniz와 Sherry입니다. Tamarind는 AlphaFold와 같은 모델을 지원하는 AI 신약 개발 (AI drug discovery)을 위한 추론 (Inference) 제공업체입니다. 바이오 제약 (Biopharma) 기업들은 저희가 보유한 선도적인 오픈 소스 (open-source) 모델 라이브러리를 사용하여 새로운 약물을 컴퓨터로 설계합니다.
데모 영상은 여기 있습니다: https://youtu.be/luoMApPeglo
2년 전, 저는 스탠퍼드 (Stanford) 연구실에 채용되어 동료들을 위해 모델을 실행하는 역할을 맡았습니다. 어떤 박사후 연구원 (post-doc)은 수만 개의 입력값에 대해 1~5개의 모델 세트를 순차적으로 실행해 달라고 요청하곤 했고, 저는 대학 클러스터 (cluster)에 워크플로우 (workflow)를 설정한 뒤 결과를 이메일로 보내주었습니다.
어느 시점부터 조직의 모든 계산 생물학 (computational biology) 작업이 학부생을 거쳐야 한다는 것은 불합리해졌고, 그래서 저희는 기술적 배경이 없어도 대규모로 사용할 수 있는 모든 분자 AI (molecular AI) 도구들을 위한 단일 플랫폼으로서 Tamarind를 구축했습니다. 오늘날 저희는 상위 20대 제약사 중 상당수, 수십 개의 바이오테크 (biotechs), 그리고 수만 명의 과학자들이 사용하고 있습니다.
대형 제약사들이 저희 서비스를 도입하기 시작했을 때, 이 문제가 여전히 지속되고 있다는 것을 발견했습니다. 저는 데이터 과학 (data science) 디렉터들을 알고 있는데, 그들 업무의 절반은 다른 사람들을 위해 스크립트 (script)를 실행하는 것이라고 설명될 수 있을 정도였습니다.
많은 기업이 내부적으로 구축한 솔루션을 폐기하고 저희로 전환하기도 했습니다. GPU 인프라 (infra)를 다루고 도커 컨테이너 (docker container)를 온보딩 (onboarding)하는 작업은, 당신이 다니는 회사가 암을 치료하려고 노력하는 상황에서는 그리 흥미로운 문제가 아니기 때문입니다.
비전문적인 추론 (inference) 제공업체들과 달리, 저희는 사용자 대부분이 비기술직이라는 점을 고려하여 개발자를 위한 프로그래밍 인터페이스 (programmatic interface)와 과학자 친화적인 웹 앱 (web app)을 모두 구축했습니다. 사용자 중 일부는 Tamarind에서 AI를 사용하여 단백질을 생성하는 방식으로 공정을 대체하기 전에는 동물의 혈액에서 단백질을 추출하곤 했습니다.
우리가 제공하는 각 모델에 대한 이미지를 생성하는 것 외에도, 각 모델의 데이터 형식(data format)을 공유할 수 있도록 표준화된 스키마(schema)를 설계했습니다. 또한, 최적의 타이밍을 위해 작업을 CPU와 GPU로 분할하는 동시에, 수평적 확장(horizontal scaling)에 최적화된 커스텀 스케줄러(scheduler)와 큐(queue)를 구축했습니다(각 추론(inference) 호출은 수 분에서 수 시간이 소요되며, 한 번에 하나의 GPU에서 실행됩니다).
고객을 대신하여 바이오 제약(biopharma) R&D AI 수요의 상당 부분을 처리할 만큼 성장함에 따라, 우리는 단순히 오픈 소스 프로토콜 라이브러리를 제공하는 것을 넘어 확장해 왔습니다.
초기부터 우리가 목격한 일반적인 사용 사례는 여러 모델을 파이프라인(pipelines)으로 연결해야 할 필요성과, 물리적 실험을 대체할 수 있는 재현 가능하고 일관된 프로토콜을 갖추는 것이었습니다. 우리가 계산 과학(computational science)을 위한 내부 도구를 구축하는 장소가 되자, 사용자들은 자신들의 모델을 플랫폼에 온보딩(onboard)할 수 있는지 묻기 시작했습니다.
그 결과, 현재 우리는 미세 조정(fine-tuning), 임의의 Docker 컨테이너를 위한 UI 구축, 습식 실험실(wet lab) 데이터 소스 연결 등을 지원하고 있습니다!
저희의 작업에 관심이 있으시다면 deniz[at]tamarind.bio로 연락해 주세요. 현재 채용 중입니다! https://app.tamarind.bio 에서 저희 제품을 확인해 보시고, 오늘날 바이오테크 산업이 AI를 사용하는 방식을 지원하기 위한 피드백이 있다면 알려주세요.
AI 자동 생성 콘텐츠
본 콘텐츠는 HN Design Systems의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기