내가 이걸 하고 있다니 믿기지 않네요. 방금 가장 큰 규모의 합성 병렬 다국어 OCR 데이터셋을 오픈 소스로 공개했습니다.

내가 이걸 하고 있다니 믿기지 않네요.
방금 가장 큰 규모의 합성 병렬 다국어 OCR (Optical Character Recognition) 데이터셋을 오픈 소스 (Open Sourced)로 공개했습니다.

100만 개 이상의 문서 이미지 (Document Images)

22개 언어 (Arabic, Bengali, German, English, Spanish, French, Gujarati, Hindi, Italian, Japanese, Kannada, Korean, Malayalam, Marathi, Odia, Punjabi, Russian, Sanskrit, Tamil, Telugu, Thai, Chinese)

6개 태스크 (OCR, 레이아웃 탐지 (Layout Detection), 레이아웃 인식 번역 (Layout-aware Translation), 문서 VQA (Document VQA), 교차 언어 검색 (Cross-lingual Retrieval), 문서 VLM 사전 학습 (Document VLM Pretraining))

추신: 이것은 2025년 코퍼스 (corpus)입니다. 2026년 버전은 약 5배 더 큽니다 (~440만 개의 이미지, 더 선명한 렌더링, 더 깨끗한 주석 (annotations)). 더 자세한 정보는 @cognitivelab_ai 에 문의하거나 contact@cognitivelab.in 으로 연락해 주세요.

Insights

내가 이걸 하고 있다니 믿기지 않네요. 방금 가장 큰 규모의 합성 병렬 다국어 OCR 데이터셋을 오픈 소스로 공개했습니다.

요약

핵심 포인트

댓글

AMD, 개발자를 위한 AI 기반 플랫폼 ROCm.AI 발표

Pinnacle Financial Partners (PNFP) 2026년 2분기 실적 발표 통찰

에이전트보다 먼저 MCP 서버를 구축해야 하는 이유: 기업이 필요로 하는 AI 팀의 변화

새로운 반도체 기업 TYLsemi 공개, 4,300만 달러 규모의 초기 단계 투자 유치 — 고객에게 저렴한 비용으로 맞춤형 실리콘을 제공하는

AMD, 개발자를 위한 AI 기반 플랫폼 ROCm.AI 발표

Pinnacle Financial Partners (PNFP) 2026년 2분기 실적 발표 통찰

에이전트보다 먼저 MCP 서버를 구축해야 하는 이유: 기업이 필요로 하는 AI 팀의 변화

새로운 반도체 기업 TYLsemi 공개, 4,300만 달러 규모의 초기 단계 투자 유치 — 고객에게 저렴한 비용으로 맞춤형 실리콘을 제공하는