
HTML 테이블 추출기
요약
브라우저에서 복사한 HTML 테이블을 Markdown, CSV, JSON 등 다양한 형식으로 변환해주는 도구를 소개합니다. Wikipedia API와 Codex를 활용하여 페이지 검색부터 테이블 자동 추출까지 가능한 기능을 제공합니다.
핵심 포인트
- 리치 텍스트 내 HTML 테이블을 다양한 포맷으로 변환 가능
- HTML, Markdown, CSV, TSV, JSON 형식 지원
- Wikipedia 공개 API를 통한 자동 데이터 추출 기능
- Codex를 활용한 Wikipedia 페이지 검색 및 테이블 자동화
2026년 6월 29일
점점 늘어가는 저의 붙여넣기 변환 도구(paste-conversion tools) 컬렉션에 추가된 또 다른 도구입니다. 이 도구는 브라우저에서 붙여넣은 리치 텍스트(rich text, HTML 테이블 포함)를 받아 감지된 모든 테이블을 HTML, Markdown, CSV, TSV 또는 JSON으로 변환합니다.
Wikipedia의 'List of cities and towns in the San Francisco Bay Area' 페이지의 모든 내용을 선택하여 도구에 직접 붙여넣어 테스트해 보세요:

이와 유사하게, 최근에 테이블 지원을 추가하고 전반적인 UI를 개선하기 위해 저의 리치 텍스트를 마크다운(markdown)으로 변환하는 도구를 다시 제작했습니다.
업데이트: Wikipedia가 모든 페이지의 전체 렌더링된 HTML 콘텐츠를 가져올 수 있는 공개 CORS API를 제공한다는 사실을 알게 되었습니다(데모는 여기에서 확인 가능). 그래서 Codex를 사용하여 Wikipedia에서 페이지를 검색한 다음, 해당 페이지의 모든 테이블을 자동으로 가져와 표시하는 기능을 추가했습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 Simon Willison Blog의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기