PP-OCRv6 로컬 워크벤치 개발 및 무료 오픈 소스 공개
요약
PP-OCRv6를 기반으로 한 로컬 OCR 워크벤치를 오픈 소스로 공개했습니다. Mac의 CoreML 가속을 지원하며, 모델 크기 선택과 다양한 파일 내보내기 기능을 제공합니다.
핵심 포인트
- PP-OCRv6 기반의 로컬 실행 워크벤치 및 오픈 소스 공개
- Apple Silicon CoreML 가속 지원 및 다양한 모델 크기 제공
- 이미지 배치 처리 및 CSV, Excel 등 다양한 결과 내보내기 지원
- 데이터 유출 걱정 없는 완전한 로컬 환경 및 브라우저 버전 지원
- OmniDocBench 및 Apple Vision 대비 벤치마킹 결과 포함
형제 여러분, 밤낮없이 매달린 끝에 드디어 완성했습니다! 그리고 전부 무료로 오픈 소스(Open-source) 공개합니다!
저는 PP-OCRv6를 바로 로컬 워크벤치(Local workbench)로 만들었습니다. Mac에서 CoreML로 가속화하며, 클릭 한 번으로 Tiny, Small, Medium 세 가지 모델 크기를 전환할 수 있습니다!
Tiny는 극도의 경량화를 위해 단 1.5MB에 불과하며, Medium은 34.5MB로 정확도(Accuracy)에 집중했고, Small은 그 중간에서 균형을 맞췄습니다.
이미지 업로드, 배치 처리(Batch processing), 결과를 CSV/Markdown/Excel로 내보내기 기능을 지원하며, 히스토리는 자동으로 저장됩니다.
모든 과정은 완전히 로컬(Locally)에서 실행되므로 개인정보가 안전하며, 어떤 데이터도 업로드할 필요가 없습니다.
가장 좋은 점은 Apple Silicon에서 CoreML 가속을 자동으로 활성화한다는 것이며, Intel Mac과 Linux에서는 CPU로 실행할 수 있습니다.
또한 Tiny 모델의 브라우저 버전도 만들어서 의존성(Dependencies) 없이 웹페이지에서 바로 OCR을 수행할 수 있습니다.
OmniDocBench 및 macOS의 내장 기능인 Apple Vision과 비교할 수 있는 벤치마킹(Benchmarking) 스크립트도 포함되어 있습니다. 실제 테스트 결과, 곡면, 도트 매트릭스 폰트, 저대비 텍스트와 같은 까다로운 시나리오에서도 견고한 성능을 보여주었습니다.
이전의 로컬 OCR에서 가장 짜증 났던 부분은 모델 다운로드, 환경 설정, 그리고 정확도와 속도 사이의 절충안을 찾는 것이었습니다. 이제 제가 그 모든 것을 패키징해 두었습니다.
개발자, 연구자, 오프라인 문서 처리(Offline document processing)가 필요한 분이라면 누구나 바로 클론(Clone)해서 사용하시면 됩니다.
이것은 사실 제가 일상적인 OCR 작업에서 수많은 시행착오를 겪은 후 틈틈이 만들어낸 결과물입니다.
같은 니즈를 가진 친구들에게 도움이 되기를 바랍니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 X @berryxia (자동 발견)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기