arXiv논문2026. 04. 29. 13:01

CGU-ILALab 의 FoodBench-QA 2026: 레시피 영양분 추정을 위한 전통적 방법과 LLM 기반 접근법 비교

요약

본 기사는 비정형 레시피 텍스트에서 정확한 영양분 추정을 위한 다양한 모델 접근법을 비교 분석했습니다. TF-IDF와 같은 전통적 방법부터 DeBERTa-v3, 그리고 LLM 기반의 생성적 추론에 이르기까지 여러 방법을 평가했습니다. 그 결과, 순수 LLM 방식이 가장 높은 예측 정확도를 보였으나, 이는 추론 지연 시간 증가라는 실용적인 트레이드오프를 수반함을 확인했습니다. 따라서 시스템 설계 시 효율성과 정밀도 사이의 균형점을 찾는 것이 중요합니다.

핵심 포인트

LLM은 사전 학습된 세계 지식을 활용하여 모호한 재료 용어와 비표준 단위를 성공적으로 해결할 수 있다.
순수 LLM 방식(Few-shot)이 가장 높은 영양분 추정 정확도를 제공한다.
전통적인 TF-IDF 기반 방법은 빠르지만, DeBERTa-v3 같은 심층 인코더보다 성능이 낮다.
최적의 시스템 구축을 위해서는 실시간 효율성(낮은 지연 시간)과 높은 정밀도 사이의 트레이드오프를 고려해야 한다.

비정형화된 레시피 텍스트에서 정확한 영양분 추정은 모호한 재료 용어와 매우 다양한 양 표현으로 인해 식이 모니터링 분야에서 중요하면서도 어려운 문제입니다. 우리는 단어 빈도 기반 매칭 방법 (TF-IDF 및 Ridge Regression) 에서부터 심층적 의미 인코더 (DeBERTa-v3), 그리고 대규모 언어 모델 (LLMs) 을 활용한 생성적 추론에 이르기까지 다양한 표현 능력을 가진 모델들을 체계적으로 평가했습니다. EU 규정 1169/2011 에 정의된 엄격한 허용 기준 하에서, 우리의 실증 결과는 예측 정확도와 계산 효율성 사이의 명확한 트레이드오프를 보여줍니다. TF-IDF 베이스라인은 거의 순간적인 추론 속도를 유지하며 중간 수준의 영양분 추정 성능을 달성하는 반면, DeBERTa-v3 인코더는 작업 특이적 데이터 부족 하에서 성능이 저하됩니다. 반면, 퓨어샷 (few-shot) LLM 추론 (예: Gemini 2.5 Flash) 과 하이브리드 LLM 정제 파이프라인 (TF-IDF 와 Gemini 2.5 Flash 의 결합) 은 모든 영양분 범주에서 가장 높은 검증 정확도를 제공합니다. 이러한 개선은 LLM 이 사전 학습된 세계 지식을 활용하여 모호한 용어를 해결하고 비표준 단위를 정규화할 수 있는 능력에 기인할 가능성이 높으며, 이는 순수하게 단어 기반 접근법으로는 여전히 어려운 과제입니다. 그러나 이러한 성과는 추론 지연 시간 (inference latency) 의 현저한 증가를 동반하므로, 식이 모니터링 시스템에서 실시간 효율성과 영양분 정밀도 사이의 실용적인 배포 트레이드오프를 강조합니다.

AI 자동 생성 콘텐츠

원문 바로가기

CGU-ILALab 의 FoodBench-QA 2026: 레시피 영양분 추정을 위한 전통적 방법과 LLM 기반 접근법 비교

요약

핵심 포인트

댓글