FAM-Bench: 상태 인지형 식사 요법(Food-as-Medicine) 추론을 위한 멀티모달 벤치마크
요약
FAM-Bench는 특정 건강 상태에 따른 음식의 적합성을 판단하는 멀티모달 벤치마크입니다. 기존의 단순 영양소 추정을 넘어, 임상 영양 제약 조건을 고려한 고차원적 추론 능력을 평가합니다.
핵심 포인트
- 13가지 식이 관련 건강 상태를 포함한 2,500개 사례 제공
- 요리 수준의 적합성 평가 및 비교 요리 분석 과업 수행
- 시각적 단서와 임상 영양 제약 조건의 통합 추론 요구
- VLM의 건강 인지적 의사결정 능력 측정 표준 제공
식사 요법 (Food-as-Medicine)은 모델이 단순히 음식이 무엇인지 또는 어떤 영양소가 포함되어 있는지를 넘어선 추론을 수행할 것을 요구합니다. 즉, 모델은 구체적인 음식 선택이 특정 건강 상태에 적절한지 여부를 결정해야 합니다. 기존의 음식 AI 벤치마크들은 주로 요리 인식 (dish recognition), 레시피 이해 (recipe understanding), 영양소 추정 (nutrient estimation), 또는 일반적인 영양 관련 질의응답 (nutrition question answering)을 평가하며, 이러한 건강 인지적 결정 계층 (health-aware decision layer)은 거의 테스트되지 않은 상태로 남아 있습니다. 우리는 13가지 식이 관련 건강 상태에 걸쳐 영양 전문가가 검증한 2,500개의 사례를 포함하는 멀티모달 식사 요법 (Food-as-Medicine) 벤치마크인 FAM-Bench를 소개합니다. 이 벤치마크는 두 가지 상호 보완적인 과업을 포함합니다: 모델이 이미지와 식재료 목록을 바탕으로 특정 요리가 특정 상태에 적합한지 판단하는 요리 수준 적합성 평가 (dish-level suitability assessment), 그리고 모델이 네 가지 후보 요리를 상태별 적합성에 따라 순위를 매기는 비교 요리 분석 (comparative dish analysis)입니다. 두 과업 모두 식재료 증거, 시각적 조리 단서, 그리고 임상 영양 제약 조건 (clinical nutrition constraints)을 통합할 것을 요구하며, 언어 모델 (language models) 및 시각-언어 모델 (vision-language models)의 근거 있는 건강 인지 추론을 위한 표준화된 테스트베드를 제공합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기