본문으로 건너뛰기

© 2026 Molayo

GeekNews헤드라인2026. 06. 04. 15:43

Show GN: VLM은 한국 공공기관 문서를 얼마나 잘 읽을까? KOLongDoc 벤치마크 공개

요약

한국어 긴 문서 이해 능력을 평가하기 위한 VLM 벤치마크인 KOLongDoc를 공개했습니다. 공공기관 문서를 기반으로 멀티페이지 추론과 고해상도 문서 이해 능력을 종합적으로 평가합니다.

핵심 포인트

  • 한국어 Long-Document VLM 전용 벤치마크 공개
  • 공공기관 문서 기반의 Multi-page/Multi-hop QA 제공
  • 고해상도 문서 및 Long-context 이해 능력 평가
  • HuggingFace 및 GitHub를 통해 오픈소스로 공개

🔥 한국어 Long-Document VLM 벤치마크, KOLongDoc를 공개했습니다!

최근 ChatGPT, Claude, Gemini 같은 멀티모달 AI가 공공·행정 업무에도 활용되기 시작했지만, 정작 "긴 한국어 문서를 얼마나 잘 이해하는가?" 를 평가할 수 있는 벤치마크는 거의 없었습니다.

기존 한국어 VLM 벤치마크들은 OCR, VQA, 차트 이해, 이미지 이해 등에 초점을 맞추고 있었지만,

❌ 수십 페이지에 달하는 고해상도 문서

❌ 여러 페이지를 오가며 정보를 연결하는 Multi-hop 추론

❌ Long-context 문서 이해

를 종합적으로 평가하기에는 한계가 있었습니다.

그래서 저희는 KOLongDoc 📄 벤치마크를 만들어서, 오픈소스로 공개했습니다!

✅ 한국 공공기관 문서 기반

✅ Multi-page / Multi-hop QA

✅ 고해상도 Long Document 이해 평가

✅ 총 200개 평가 문항 제공

KOLongDoc는 국내외 VLM들이 실제 한국어 공공문서를 얼마나 정확하게 이해하고 추론할 수 있는지 평가하기 위한 벤치마크입니다.

자세한 내용과 활용방법이 궁금하시다면, huggingface와 github 방문해주세요!

🤗 데이터셋:

https://huggingface.co/datasets/Markr-AI/KOLongDoc

📝 Github 소개 글:

https://github.com/Marker-Inc-Korea/KOLongDoc

*피드백과 벤치마크 활용 사례를 환영합니다!

AI 자동 생성 콘텐츠

본 콘텐츠는 GeekNews의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0