
브라우저에서 오프라인으로 PDF를 Markdown으로 변환하는 방법 (서버 업로드 불필요)
요약
이 글은 서버 업로드 없이 웹 브라우저에서 PDF를 Markdown으로 변환하는 클라이언트 측 도구(LiteDoc)를 소개합니다. pdf.js와 Tesseract.js를 활용하여 텍스트, 이미지, 표 등 다양한 요소를 추출하고 표준 Markdown 형식으로 출력할 수 있습니다.
핵심 포인트
- 서버 업로드 불필요: 완전히 클라이언트 측에서 작동하는 변환기입니다.
- 다중 기능 지원: OCR(Tesseract.js), PDF 파싱(pdf.js)을 결합했습니다.
- 지원 범위 넓음: 비밀번호 보호, RTL 언어, 손상된 글꼴도 처리 가능합니다.
웹 브라우저에서 서버에 파일을 업로드할 필요 없이, 오프라인으로 PDF를 Markdown으로 변환합니다.
https://github.com/0xovo/LiteDoc
순수 클라이언트 측(client-side)이며 설정이 필요 없는(zero-configuration) PDF를 Markdown으로 변환하는 도구로, 브라우저 내에서 완전히 실행됩니다. pdf.js를 사용하여 PDF를 파싱하고, Tesseract.js (WASM 버전)를 통해 스캔된 문서의 OCR을 지원하여 텍스트, 이미지, 표, 수학 공식 등을 추출한 후 표준 Markdown 형식으로 출력합니다. 비밀번호로 보호된 문서, RTL 언어(Right-to-Left), 손상된 글꼴 처리도 지원합니다.
OSINT 매핑 도구 — 오픈 소스 인텔리전스 관계 매핑 도구
오픈 소스 인텔리전스 조사를 브라우저에서 정리하고, 소셜 계정, 전화번호, 차량 등 식별자를 지리적 위치와 연관시키고 매핑할 수 있습니다.
https://github.com/anonymousRAID/
OSINT-Mapping-Tool
...
A
AI 자동 생성 콘텐츠
본 콘텐츠는 X @qingq77 (검증됨)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기