
헬스케어 AI 개발을 위한 개방형 모델, MedGemma 출시
요약
Google Research가 의료 분야 인공지능(AI) 개발을 가속화할 수 있는 강력한 오픈 모델 컬렉션 'MedGemma'를 공개했습니다. MedGemma는 Gemma 3 기반의 다중 모드 생성 모델로, 4B 및 27B 크기 변형을 포함하며 이미지와 텍스트 입력을 받아 텍스트 출력을 생성합니다. 특히 최신 버전인 MedGemma 27B Multimodal은 복잡한 다중 모드 및 종단적 전자의무기록(EHR) 해석 기능을 지원합니다. 또한, 의료 이미지를 위한 경량 인코더 'MedSigLIP'도 함께 출시되어 분류, 검색 등 다양한
핵심 포인트
- MedGemma는 4B와 27B 크기로 제공되며, 이미지 및 텍스트 입력을 처리하는 다중 모드 생성 모델입니다.
- 새로 추가된 MedGemma 27B Multimodal은 복잡한 전자의무기록(EHR) 해석 기능을 지원하여 활용도가 높습니다.
- MedSigLIP은 의료 이미지를 위한 경량 인코더로, 분류 및 검색 작업에 최적화되어 있습니다.
- 오픈 모델 방식 덕분에 개발자는 개인 정보 보호와 맞춤형 수정 등 높은 수준의 통제권을 유지할 수 있습니다.
Google Research가 의료 AI(Health AI) 분야 개발을 위한 강력한 오픈 모델 컬렉션 'MedGemma'를 발표했습니다. 이 컬렉션은 Gemma 3 기반으로 구축되었으며, 4B 및 27B 크기의 다중 모드 생성 모델을 포함합니다.
이번에 새롭게 공개된 MedGemma 27B Multimodal은 기존 모델들의 기능을 보완하여 복잡한 다중 모드 데이터와 종단적 전자의무기록(EHR) 해석 능력을 추가했습니다. 또한, 의료 이미지를 위한 경량 인코더 'MedSigLIP'도 함께 출시되어 분류 및 검색 작업에 특화되었습니다.
MedGemma는 텍스트 또는 이미지 기반의 보고서 생성이나 시각적 질문 답변(VQA) 등 자유 형식의 텍스트 생성이 필요할 때 유용하며, MedSigLIP은 분류나 정보 검색처럼 구조화된 출력이 필요한 이미징 작업에 적합합니다. 모든 모델은 단일 GPU에서 구동 가능하며, 일부는 모바일 환경에도 최적화될 수 있습니다.
MedGemma 4B와 27B 모델 모두 MedQA 벤치마크 등지에서 높은 성능을 보여주며, 특히 MedGemma 27B Text 버전은 경쟁사 대비 낮은 추론 비용으로 우수한 성능을 입증했습니다. 개발자는 이 오픈 모델들을 기반으로 자신들의 특정 의료 애플리케이션에 맞게 파인튜닝(fine-tuning)하여 최신 성능을 달성할 수 있습니다.
MedSigLIP은 4억 개 매개변수(parameters)의 경량 이미지 인코더로, 다양한 의료 영상 데이터(흉부 X-ray, 조직병리 등)를 학습했습니다. 이는 의료 이미지를 공통 임베딩 공간에 담아 텍스트와 연결함으로써, 분류나 시맨틱 검색 등의 범용성을 높여줍니다.
이러한 오픈 모델 접근 방식은 API 기반 모델 대비 개발자에게 최고의 유연성과 데이터 프라이버시를 제공한다는 큰 장점을 가집니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 Google DeepMind의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기