NuExtract3는 문서 이해를 위한 통합된 4B 비전-언어 추론 모델 (vision-language reasoning model)입니다.

이 모델은 강력한 구조화된 정보 추출 (structured information extraction) 기능과 고품질의 이미지-마크다운 (image-to-Markdown) 변환 기능을 결합하여, 스캔본, 영수증, 양식, 송장, 계약서 또는 표와 같은 모든 유형의 문서에 대한 추출 파이프라인, OCR 및 RAG 전처리에 적합합니다.

개요 (Overview)

구조화된 추출 (Structured extraction): 입력 (텍스트/이미지) + JSON 템플릿 + 지시사항 $\rightarrow$ JSON 출력
마크다운 변환 (Markdown conversion): 입력 (텍스트/이미지) $\rightarrow$ 마크다운 (Markdown)
멀티모달 입력 (Multimodal inputs): 텍스트, 이미지, 또는 텍스트 + 이미지
다국어 (Multilingual) 문서 지원
추론 (Reasoning) 및 비추론 추론 모드
자연어 또는 입력 문서로부터 구조화된 추출을 위한 템플릿 생성 (Template generation)

GGUF, NVFP4, MLX, VLLM 등이 이미 지원됩니다.

https://huggingface.co/models?other=base_model:quantized:numind/NuExtract3

Insights

numind/NuExtract3 · Hugging Face

요약

핵심 포인트

개요 (Overview)

댓글

BrassCoders가 잡아낼 수 없는 공격: 프롬프트 인젝션 (Prompt Injection)

영국 CFO들, 비용 통제를 대졸 신입 채용 축소의 주요 원인으로 지목

밀레니얼 세대를 위한 401(k) 저축 기준: 당신의 은퇴 자금은 계획대로 진행되고 있습니까?

Take-Two Interactive의 2027 회계연도 1분기 실적 발표 전망

BrassCoders가 잡아낼 수 없는 공격: 프롬프트 인젝션 (Prompt Injection)

영국 CFO들, 비용 통제를 대졸 신입 채용 축소의 주요 원인으로 지목

밀레니얼 세대를 위한 401(k) 저축 기준: 당신의 은퇴 자금은 계획대로 진행되고 있습니까?

Take-Two Interactive의 2027 회계연도 1분기 실적 발표 전망