Rongxin Ouyang, 영어를 제외한 모든 연구자들이 남몰래 겪어온 단 하나의 문제를 해결하다
요약
PDFMathTranslate는 수학 공식, 차트, 표 등 논문의 레이아웃을 완벽하게 유지하며 번역하는 오픈소스 도구입니다. AI 레이아웃 탐지 기술을 통해 원문의 서식을 보존하며, 다양한 번역 엔진과 로컬 실행 환경을 지원합니다.
핵심 포인트
- 수식, 표, 차트 등 논문의 복잡한 레이아웃을 완벽하게 보존
- Google Translate, DeepL, OpenAI 등 다양한 번역 엔진 선택 가능
- GUI, CLI, Docker, Zotero 플러그인 등 폭넓은 사용 환경 지원
- EMNLP 2025에 채택된 검증된 연구 기반의 오픈소스 소프트웨어
Rongxin Ouyang은 영어를 사용하는 국가 이외의 모든 연구자들이 남몰래 고통받아온 단 하나의 문제를 해결했습니다.
그것은 바로 PDF입니다…
그 이름은 PDFMathTranslate입니다. 이 도구는 모든 수학 공식, 모든 차트, 모든 표, 그리고 모든 레이아웃 요소를 완벽하게 유지하면서 과학 논문 전체를 번역합니다.
Google Translate에 복사해서 붙여넣을 필요도 없습니다. 수식을 잃어버릴 일도 없습니다. 47페이지에 달하는 문서를 수작업으로 다시 편집할 필요도 없습니다.
Google Translate과 LaTeX가 만났지만, 실제 PDF에서 제대로 작동하는 도구라고 생각하면 됩니다.
이 도구가 하는 일은 다음과 같습니다:
→ 어떤 PDF든 넣으세요. 언어를 선택하세요. 번역을 누르세요.
→ 수학 공식, 차트, 표, 각주. 모두 보존됩니다.
→ 이중 언어(Bilingual) PDF 출력. 원문과 번역본이 나란히 배치됩니다.
→ Google Translate, DeepL, OpenAI, Ollama. 원하는 것을 선택하세요.
→ 로컬(Locally)에서 실행 가능. 논문이 기기를 떠나지 않습니다.
→ GUI, CLI, Docker, Zotero 플러그인, MCP 서버 지원.
가장 놀라운 부분은 이겁니다:
대부분의 PDF 번역기는 레이아웃을 망가뜨립니다. 공식은 깨진 텍스트가 되고, 표는 구조를 잃으며, 차트는 사라집니다. 번역본을 읽는 시간보다 번역을 수정하는 데 더 많은 시간을 쓰게 됩니다.
PDFMathTranslate는 AI 레이아웃 탐지(AI layout detection)를 사용하여 페이지의 모든 요소가 어디에 위치하는지 이해하고, 텍스트만 번역한 뒤, 원래의 서식을 유지한 채 문서 전체를 재구성합니다.
이 연구는 세계 최고의 NLP 컨퍼런스 중 하나인 EMNLP 2025에 채택되었습니다. 이것은 단순한 사이드 프로젝트가 아닙니다. 동료 검토(Peer-reviewed)를 거친 연구가 무료 소프트웨어로 구현된 것입니다.
222,000회 이상의 다운로드. 49,000회 이상의 Docker pull. 일주일 넘게 GitHub 글로벌 트렌딩 상위권을 차지했습니다.
이것을 만든 연구자들은 싱가포르 국립대학교(NUS)와 칭화대학교 출신입니다. 그들은 언어 장벽이 과학을 가로막아서는 안 된다는 이유로 이를 오픈 소스(Open source)로 공개했습니다.
전문적인 PDF 번역 서비스는 단어당 0.10달러에서 0.25달러를 청구합니다. 30페이지 분량의 연구 논문은 대략 10,000단어입니다. 논문 한 편당 1,000달러에서 2,500달러가 듭니다.
PDFMathTranslate는 이를 단 몇 분 만에, 0달러에 해냅니다.
이것은 영어를 사용하지 않는 모든 연구자가 20년 동안 기다려온 도구입니다.
여러분의 노트북에서 실행됩니다. 명령어 하나로 설치할 수 있습니다.
100% 오픈 소스 (Open Source). MIT 라이선스 (MIT License).
AI 자동 생성 콘텐츠
본 콘텐츠는 X @heynavtoor (자동 발견)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기