본문으로 건너뛰기

© 2026 Molayo

Reddit요약2026. 05. 26. 05:42

numind/NuExtract3 · Hugging Face

요약

NuExtract3는 문서 이해를 위해 설계된 4B 파라미터 규모의 비전-언어 추론 모델입니다. 구조화된 정보 추출과 이미지-마크다운 변환 기능을 결합하여 OCR 및 RAG 전처리에 최적화되어 있습니다.

핵심 포인트

  • JSON 템플릿을 활용한 강력한 구조화된 정보 추출 기능
  • 이미지를 마크다운 형식으로 변환하는 멀티모달 기능 지원
  • 스캔본, 영수증, 계약서 등 다양한 문서 유형 처리 가능
  • GGUF, MLX, vLLM 등 다양한 추론 프레임워크 지원

NuExtract3는 문서 이해를 위한 통합된 4B 비전-언어 추론 모델 (vision-language reasoning model)입니다.

이 모델은 강력한 구조화된 정보 추출 (structured information extraction) 기능과 고품질의 이미지-마크다운 (image-to-Markdown) 변환 기능을 결합하여, 스캔본, 영수증, 양식, 송장, 계약서 또는 표와 같은 모든 유형의 문서에 대한 추출 파이프라인, OCR 및 RAG 전처리에 적합합니다.

개요 (Overview)

  • 구조화된 추출 (Structured extraction): 입력 (텍스트/이미지) + JSON 템플릿 + 지시사항 $\rightarrow$ JSON 출력
  • 마크다운 변환 (Markdown conversion): 입력 (텍스트/이미지) $\rightarrow$ 마크다운 (Markdown)
  • 멀티모달 입력 (Multimodal inputs): 텍스트, 이미지, 또는 텍스트 + 이미지
  • 다국어 (Multilingual) 문서 지원
  • 추론 (Reasoning) 및 비추론 추론 모드
  • 자연어 또는 입력 문서로부터 구조화된 추출을 위한 템플릿 생성 (Template generation)

GGUF, NVFP4, MLX, VLLM 등이 이미 지원됩니다.

https://huggingface.co/models?other=base_model:quantized:numind/NuExtract3

AI 자동 생성 콘텐츠

본 콘텐츠는 Reddit AI Engineering의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0