본문으로 건너뛰기

© 2026 Molayo

X요약2026. 05. 31. 20:05

이 오픈 소스 OCR 모델은 말도 안 되게 뛰어납니다

요약

Surya OCR은 1B 미만의 파라미터로 91개 언어를 지원하는 고성능 오픈 소스 OCR 모델입니다. olmOCR 벤치마크에서 3B 미만 모델 중 최고 성능을 기록하며 문서 지능의 새로운 기준을 제시합니다.

핵심 포인트

  • 1B 미만 파라미터로 91개 언어 지원
  • RTX 5090 기준 초당 5페이지 처리 가능
  • olmOCR 벤치마크 83.3%로 동급 최고 성능
  • CPU, GPU, Apple Silicon 등 다양한 환경 지원

이 오픈 소스 (open-source) OCR 모델은 말도 안 되게 뛰어납니다.

• 1B (10억) 미만의 파라미터 (parameters)
• 91개 언어 지원
• RTX 5090에서 초당 5페이지 처리
• CPU, GPU 및 Apple Silicon에서 실행 가능
• olmOCR 벤치마크에서 83.3% 기록 (3B 미만 모델 중 최고 성능)

Surya OCR은 문서 지능 (document intelligence)을 완전히 새로운 수준으로 끌어올리고 있습니다.

Github 링크 :
https://github.com/datalab-to/surya
...

Karpathy의 CLAUDE.md가 방금 GitHub Trending 1위를 차지했습니다.

220,000개 이상의 스타 (stars).

대부분의 개발자들은 아직 이것을 읽지 않았습니다.

단 65줄뿐입니다.

하지만 이것이 AI 코딩 정확도를 65%에서 94%로 높였다고 보고되었습니다.

전체 플레이북 (playbook):

→ 코딩하기 전에 생각하라
→ 극도로 단순함을 유지하라
→ 오직...

AI 자동 생성 콘텐츠

본 콘텐츠는 X @indutripat82427 (자동 발견)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0