Surya: RTX 5090에서 초당 5페이지를 처리하며 olmOCR-bench 83.3%를 달성한 650M 파라미터 오픈 소스 OCR 모델
요약
Surya는 650M 파라미터 규모의 오픈 소스 OCR 모델로, olmOCR-bench에서 83.3%의 높은 정확도를 기록했습니다. RTX 5090 환경에서 초당 5페이지를 처리하며 뛰어난 성능과 효율성을 동시에 보여줍니다.
핵심 포인트
- 3B 미만 모델 중 olmOCR-bench 최고 수준 성능 달성
- RTX 5090 기준 초당 5페이지의 빠른 처리 속도
- 91개 언어를 지원하는 강력한 다국어 능력
- 레이아웃 분석, 읽기 순서 및 표 인식 기능 내장
Surya는 RTX 5090에서 초당 5페이지를 처리하며 olmOCR-bench에서 83.3%를 달성한 650M 파라미터 (parameter) 오픈 소스 (open-source) OCR 모델입니다.
- olmOCR-bench에서 83.3% 정확도 달성, 3B 파라미터 미만 모델 중 최고 수준
- RTX 5090에서 초당 5페이지의 처리량 (throughput) 기록
- 91개 언어 다국어 벤치마크 (multilingual benchmark)에서 87.2% 달성
- 레이아웃 분석 (layout analysis), 읽기 순서 (reading order) 및 표 인식 (table recognition) 기능 내장
여기에서 확인해 보세요:
AI 자동 생성 콘텐츠
본 콘텐츠는 X @githubprojects (자동 발견)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기