본문으로 건너뛰기

© 2026 Molayo

Deep Tech요약2026. 04. 27. 13:02

새 OCR 모델 olmocr, 4B 파라미터로 SOTA 달성

요약

새로운 오픈소스 OCR 모델 'olmocr'이 기존 9B 모델보다 작은 4B 파라미터 규모임에도 불구하고 olmocr 벤치에서 85.9%의 최고 정확도(SOTA)를 기록했습니다. 90 개 이상의 언어를 지원하며, 이미지와 다이어그램에서 텍스트를 추출하고 복잡한 수학 공식, 표, 손글씨까지 인식하는 강력한 성능을 보였습니다. 이 모델은 완전한 오픈소스 코드이며, 지능이 외부에 존재할 수 있다는 생물물리학자 더글러스 유반의 흥미로운 아이디어도 함께 소개됩니다.

핵심 포인트

  • 4B 파라미터 규모의 olmocr 모델이 olmocr 벤치에서 85.9%의 SOTA 정확도를 달성함
  • 90 개 이상의 언어를 지원하며 이미지, 다이어그램, 수학 공식, 표, 손글씨까지 인식 가능
  • 완전 오픈소스이며 생물물리학자 더글러스 유반의 '양자 지능' 논문 아이디어도 소개됨

Herkes bu yeni OCR modelini göz ardı ediyor!

  • olmocr bench'te %85,9 (sota)
  • 90'dan fazla dil desteği ve kıyaslama testleri
  • 4B model (9B'den düşürüldü)
  • Tam düzen bilgisi
  • Görüntü ve diyagramlardan altyazı çıkarır
  • Güçlü el yazısı, matematik, form, tablo desteki

%100 açık kaynak kodlu.

Ya beyniniz zekayı üretmiyor da ona uyum sağlıyorsa?

생물물리학자 더글러스 유반 (Douglas Youvan) 의 대담한 아이디어가 있다: 지능이 어쩌면 우리 머릿속에 갇혀 있지 않을지도 모른다. 유반의 논문 "양자 지능: 비국소적 의식, 연결성, 그리고 인공지능이 정신을 어떻게 재정의하는가"

AI 자동 생성 콘텐츠

본 콘텐츠는 X @DeepTechTR (AI/오픈소스)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
3

댓글

0