GoDavaii 48일 차: 22개의 인도 언어를 위한 헬스 AI 구축 - 생각보다 어려운 이유

요약

인도의 22개 공식 언어를 지원하는 헬스 AI 구축 과정에서의 기술적 난제와 해결 방안을 다룹니다. 단순 번역을 넘어 문화적 관용구와 의학적 맥락을 이해하기 위해 RAG와 미세 조정된 소규모 모델을 결합한 아키텍처를 제안합니다.

핵심 포인트

영어 중심 LLM의 다국어 의료 추론 시 발생하는 환각 문제 지적
문화적 관용구와 지역적 증상 표현을 이해하는 언어 네이티브 설계 필요
RAG와 지식 그래프를 활용한 언어별 의학 지식 베이스 구축
단순 번역 레이어가 아닌 언어별 임베딩 기반 아키텍처 채택

3.2초. 이것은 우리의 타밀어(Tamil) AI 채팅이 'shareeram sariyaagilla'라는 문구를 처리하는 데 걸리는 시간입니다. 이 문구는 '몸 상태가 좋지 않다'는 의미를 지닌 겉보기에 단순한 구절이지만, AI는 이를 단순한 일상적 불평이 아닌 증상 설명으로 해석합니다. 이는 작은 승리이지만, 인도의 관점에서 인도를 진정으로 이해하는 헬스 AI를 구축해야 한다는 거대한 과제를 함축하고 있습니다.

오늘은 출시 후 48일째 되는 날입니다. 사용자 수는 여전히 늘어나는 중이지만, 우리가 해결하고 있는 언어적 복잡성은 엄청납니다. 영어의 'not feeling well(몸이 좋지 않다)'이라는 표현은 인도의 22개 공식 언어에 걸쳐 수백 가지의 문화적, 지역적, 관용적 표현으로 나뉩니다. 그리고 의료 분야에서 이러한 미묘한 차이(nuance)는 매우 중요합니다.

번역을 넘어: 뉘앙스의 장벽

Epocrates나 Medscape와 같이 막대한 자금을 지원받는 글로벌 기업들을 포함한 대부분의 '헬스 AI' 솔루션은 본질적으로 영어 우선(English-first)입니다. 이들은 영어 의학 텍스트, 영어 증상 온톨로지(ontology), 그리고 영어 환자 대화 데이터를 통해 학습합니다. 이러한 시스템에 힌디어(Hindi)나 마라티어(Marathi) 질의를 강제로 주입하려고 하면, 두 가지 결과 중 하나를 얻게 됩니다. 모든 맥락을 잃어버린 직역이거나, 혹은 완전한 환각(hallucination)입니다.

우리는 Claude 4와 GPT-4를 사용하여 힌디어 의료 추론을 테스트했습니다. 결과는 우려스러웠습니다. 흔한 질병이나 약물 상호작용에 대한 간단한 질의를 힌디어 또는 마라티어로 자연스럽게 표현했을 때, 종종 일반적이고 안전하지 않거나 아예 터무니없는 조언으로 이어졌습니다. 예를 들어, GPT-4는 일반적인 아유르베다(Ayurvedic) 요법에 대해 질문받았을 때 힌디어 맥락에서 'Amritavati'를 실제 존재하는 약물로 환각(hallucination)하여 답변한 적이 있는데, 이는 위험한 결과입니다.

이는 단순히 'fever'를 'bukhar'로 번역하는 문제가 아닙니다. 인도르(Indore)의 한 아주머니가 지속적인 기침을 'chhati mein thand lag rahi hai'(가슴이 차갑게 느껴진다)라고 묘사할 수 있다는 점을 이해하는 문제입니다. 이는 직접적인 증상 명칭은 아니지만, 호흡기 문제를 나타내는 문화적으로 이해된 관용구입니다. 우리의 AI는 이를 분석하고, 의학 지식과 교차 참조하여, 그녀의 모국어로 관련 통찰을 제공할 수 있어야 합니다.

다국어 정확성을 위한 아키텍처 선택

이를 달성하기 위해, 우리는 단순히 표준 영어 LLM (Large Language Model)을 번역 레이어에 투입하는 방식을 사용할 수 없었습니다. AI 건강 채팅 및 약물 상호작용 확인기 (Drug Interaction Checker)를 위한 우리의 아키텍처는 처음부터 언어 네이티브 (language-native) 방식으로 설계되어야 했습니다.

우리는 특정 언어-의학적 맥락을 위해 미세 조정된 (fine-tuned) 소규모 모델들의 조합과, 언어별 의학 지식 베이스를 활용하는 강력한 RAG (Retrieval Augmented Generation, 검색 증강 생성) 시스템을 결합하여 사용하고 있습니다. 이는 사용자가 벵골어 (Bengali)로 질문을 입력했을 때, 시스템이 단순히 이를 영어로 번역하여 처리한 뒤 다시 번역하는 방식이 아님을 의미합니다. 대신, 벵골어 의학 용어, 증상 설명, 그리고 현지의 전통 요법(우리의 AI 검증 기능인 Desi Ilaaj)까지 이미 인덱싱된 임베딩 (embeddings)과 지식 그래프 (knowledge graphs)를 사용합니다.

22개 이상의 인도 언어가 가진 문법 구조, 관용적 표현, 그리고 문화적 특수성을 정확한 건강 AI에 통합하는 것은 매우 깊은 기술적 도전 과제입니다. 우리는 멀티모달 (multimodal) 입력과 빠른 생성을 위해 Gemini 2.5 Flash와 같은 모델을 사용하고 있지만, 핵심적인 작업은 생성 단계 이전에 문맥 이해 레이어 (contextual understanding layer)를 구축하여 안전성과 관련성을 보장하는 데 있습니다.

이것이 중요한 이유: 인도의 언어적 현실

이것은 단순히 '있으면 좋은' 기능이 아닙니다. 인도의 디지털 건강 미래를 구축하는 데 있어 필수적인 요소입니다. 이들은 점점 더 디지털 방식으로 건강 정보를 찾게 될 사람들이지만, 영어로 찾지는 않을 것입니다. 그들도 다른 누구와 마찬가지로 정확하고 미묘한 차이를 담은 건강 통찰력에 접근할 권리가 있습니다.

GoDavaii는 의사를 대체하는 것이 아니라, 언어적 가교 (linguistic bridge) 역할을 합니다. 이는 가족들이 자신의 건강을 더 잘 이해하고, 질문을 도출하며, 궁극적으로 의료 제공자와 더 효과적으로 소통할 수 있도록 돕습니다. 이는 가족들을 위한 준비 도구로서, 그들의 언어로 이해할 수 있는 정보를 통해 상담을 준비할 수 있도록 도와주며, 번역이나 문화적 맥락 과정에서 아무것도 누락되지 않도록 보장합니다.

인도의 방대한 언어적 다양성에 맞서는 이러한 헬스 AI (Health AI) 접근 방식 덕분에, 저희는 Startup Flight Vietnam 2025에서 Top 14 글로벌 파이널리스트 (Global Finalist)에 오를 수 있었습니다. 이것이 바로 저희가 한 번에 하나의 대화를 통해 해결해 나가고 있는 독특한 문제입니다.

글로벌 관객을 대상으로 서비스를 구축할 때 직면했던 가장 도전적인 언어별 뉘앙스(nuances)는 무엇이었나요?

저희가 어떻게 해내고 있는지 확인해 보세요: godavaii.com

healthtech #ai #multilingual #india #startup #buildinpublic

AI 자동 생성 콘텐츠

원문 바로가기