
AI 시대에는 어떤 파일 형식으로 업무를 해야 하는가
요약
AI 워크플로우 도입 시 기존의 문서 형식(Word, Excel, PDF 등)이 AI의 데이터 처리 효율을 저해하는 마찰 원인이 될 수 있음을 지적합니다. AI가 읽기 쉬운 파일 형식과 인간이 읽기 좋은 형식 사이의 격차를 이해하고, Markdown과 같은 구조화된 텍스트 형식을 활용하는 전략이 필요함을 제시합니다.
핵심 포인트
- AI는 텍스트 에디터로 열었을 때 내용이 그대로 읽히는 플레인 텍스트 형식을 가장 잘 처리함
- Markdown은 구조 파악이 용이하고 Git을 통한 버전 관리가 가능하여 AI 시대의 최적화된 문서 형식임
- PDF나 Excel은 서식 및 레이아웃 정보가 많아 AI가 순수 데이터를 추출하는 데 어려움을 겪을 수 있음
- 업무 효율을 위해 파일의 용도에 따라 AI 처리 용이성과 인간의 가독성을 고려한 형식 선택이 필요함
업무용 파일 형식을 고민해 본 적이 있는가.
"보고서는 Word", "데이터 관리는 Excel", "슬라이드는 PowerPoint". 이것이 당연해진 지 오래되었다. 하지만 AI를 업무 워크플로우 (Workflow)에 도입하기 시작하면, 이 "당연함"이 사실은 큰 마찰 원인이 되고 있다는 것을 깨닫게 된다.
AI에게 Excel을 주었을 때 어떤 일이 일어날지 생각해 보길 바란다. 셀의 서식 정보, 병합된 셀, 조건부 서식, 여러 개의 시트, 매크로. AI가 "읽고 싶은" 것은 내부의 데이터지만, Excel은 그 외의 정보를 대량으로 품고 있다. PDF는 더욱 심각하다. 레이아웃 정보와 문자 정보가 혼재되어 있어, 표의 내용을 정확하게 추출하는 것조차 고역이다.
이 기사에서는 AI 시대에 "AI와 궁합이 좋은 파일 형식"을 정리한다. 모든 파일을 Markdown이나 JSON으로 바꿔야 한다는 이야기가 아니다. "어떤 파일을 어떤 형식으로 보유해야 하는가"에 대한 판단 기준을 제시한다.
AI가 파일을 읽는 경로는 크게 두 가지다.
① 파일을 직접 첨부하여 AI에게 전달
PDF나 Word를 Claude나 ChatGPT에 첨부하여 "요약해줘", "분석해줘"라고 지시하는 케이스.
② 프로그램·에이전트가 파일을 읽어 AI에게 전달
Claude Code나 N8N 등이 자동으로 파일을 읽어 LLM에 컨텍스트 (Context)로 전달하는 케이스.
두 경우 모두 "AI가 처리하기 쉬운 파일 형식"과 "인간이 관리하기 쉬운 파일 형식" 사이에 격차가 발생한다. 그 격차를 의식하지 않고 업무를 하면, AI와의 연동 포인트에서 매번 변환 작업이 발생한다.
각 파일 형식의 "AI 처리 용이성"과 "인간의 가독성"을 정리한다.
| 형식 | AI 처리 용이성 | 인간의 가독성 | 적합한 용도 |
|---|---|---|---|
.md (Markdown) | ◎ | ◎ | 문서·사양서·메모·도큐먼트 |
.txt (Plain Text) | ◎ | ◎ | 로그·메모·단순 텍스트 |
.json | ◎ | △ (숙련 필요) | 설정·구조화 데이터·API 연동 |
.yaml | ◎ | ○ | 설정 파일·플로우 정의 |
.csv | ○ | ○ | 표 형식 데이터·수치 데이터 |
.html | ○ | △ (태그가 방해됨) | Web 콘텐츠 |
.docx (Word) | △ | ○ | 최종 결과물·공식 문서 |
.xlsx (Excel) | △ | ○ | 복잡한 계산·재무 모델 |
.pdf | △~✕ | ○ | 인쇄·배포·계약서 |
.pptx (PowerPoint) | △ | ○ | 프레젠테이션·제안 |
"AI 처리 용이성"의 판단 기준은 심플하다. "텍스트 에디터로 열었을 때, 내용이 그대로 읽히는가". 읽을 수 있는 파일은 AI도 직접 처리할 수 있다. 읽을 수 없는 파일은 변환이 필요하게 된다.
Markdown은 AI와 궁합이 가장 좋은 도큐먼트 형식이다.
이유는 세 가지가 있다.
① 플레인 텍스트 (Plain Text)이므로 AI가 그대로 읽을 수 있다
Word나 PDF와 같은 변환이 필요 없으며, 파일을 그대로 붙여넣는 것만으로 AI가 구조를 이해할 수 있다.
② 제목·리스트·코드 블록의 구조가 AI에게 전달된다
## 제목이나 - 리스트와 같은 표기법은 AI가 "이 문서가 어떻게 구성되어 있는가"를 정확하게 파악하기 위한 정보가 된다.
③ Git이나 GitHub에서 버전 관리(Version Control)를 할 수 있다
차이점(Diff)을 행 단위로 추적할 수 있기 때문에, 사양서나 설계서의 변경 이력을 코드와 동일한 방법으로 관리할 수 있다.
| 기존 방식 | Markdown으로 전환 |
|---|---|
| Word로 작성하는 사양서 | spec.md |
| ... | doc.md (로컬 관리) |
| README가 없는 리포지토리 | README.md |
# 온도 알람 기능 사양
## 개요
센서의 온도가 임계값을 초과할 경우 알람을 발생시킨다.
...
이것을 AI에게 전달하면 "임계값 수치" "히스테리시스 설계" "GPIO 설정" "확정 조건의 상세 내용"을 전부 정확하게 파악한 상태에서 코드를 생성해 준다. Word나 PDF로 같은 일을 하려고 하면 변환이나 첨부가 필요하게 된다.
JSON이 적합한 케이스
- 프로그램에서 읽고 쓰는 데이터
- API의 요청(Request)·응답(Response)
- AI를 위한 구조화된 인풋 (Few-shot 데이터셋 등)
- 설정값 저장
YAML이 적합한 케이스
- 사람이 직접 편집하는 설정 파일 (Configuration file)
- CI/CD 파이프라인 정의
- CLAUDE.md의 대안으로 구조화된 규칙을 작성
# business_rules.yaml
project: 임베디드 Firmware 개발
team: 임베디드 개발부
...
이 파일을 CLAUDE.md에 기재하거나 AI를 위한 프롬프트 (Prompt)에 첨부하는 것만으로도, 매번 동일한 규칙을 언어화해야 하는 번거로움을 없앨 수 있다.
Excel 대신 사용할 수 있는 경우가 많다.
-
계산식이 없음 (수치를 나열하고 있을 뿐임)
-
그래프가 불필요함
-
시트가 1장임
-
서식 설정 (Formatting)이 불필요함
-
재무 모델 등 복잡한 계산식이 있음
-
피벗 테이블 (Pivot Table)을 사용함
-
상사·클라이언트에게 제출하는 문서 (상대방이 Excel을 요구함)
날짜,담당,태스크,상태,비고
2026-04-01,다나카,사양서 작성,완료,
2026-04-03,스즈키,코드 리뷰,진행 중,PR#42
...
헤더 행 (Header row)을 반드시 넣는다. 열 이름이 명확하다면 AI는 '무슨 데이터인지'를 자동으로 이해한다.
완전히 버릴 필요는 없다. '최종 결과물'과 '작업 파일'을 분리한다는 발상이 실용적이다.
작업 흐름:
Markdown (작업·AI와의 연계)
↓
...
Pandoc이라는 도구를 사용하면 Markdown에서 Word·PDF·HTML로의 변환은 단 한 번의 명령어로 완료된다.
# Markdown에서 Word로 변환
pandoc spec.md -o spec.docx
# Markdown에서 PDF로 변환
...
"고객에게는 Word로 전달해야 하지만, 사내 작업은 Markdown으로 한다"라는 구분 사용이 가장 현실적이다.
Claude Code나 N8N, Claude Cowork와 같은 에이전트 (Agent)가 자동으로 파일을 읽고 쓰는 환경에서는, 파일 형식의 선택이 에이전트의 처리 효율로 직결된다.
에이전트에게 읽히는 파일의 설계 원칙
① 1파일에 1개의 개념·목적
✓ requirements.md (요건)
✗ requirements_and_design_and_test.docx (무엇이든 다 들어있음)
...
이것을 철저히 지키는 것만으로도 AI 에이전트가 "이 파일은 무엇인가", "언제 작성되었는가", "누가 무엇을 위해 작성했는가"를 자동으로 판단할 수 있게 된다.
갑자기 전부 전환하는 것은 현실적이지 않다. 다음 순서로 진행하는 것이 무리가 없다.
페이즈 1 (이번 주부터)
새로 만드는 메모·회의록·사양서는 Markdown으로 쓰기 시작한다. 기존 파일은 그대로 둔다.
페이즈 2 (1개월 이내)
자주 사용하는 설정·규칙·체크리스트를 YAML이나 Markdown으로 이행한다. CLAUDE.md를 만든다.
페이즈 3 (3개월 이내)
데이터 관리에 사용 중인 Excel 중 계산식이 없는 것을 CSV로 변환한다.
바꾸지 않아도 되는 것
- 재무 모델·복잡한 계산식이 포함된 Excel
- 대외적인 제출물 (상대방이 Word·Excel을 요구함)
- 계약서·공식 문서 (PDF가 요구됨)
AI 시대의 파일 관리 원칙을 한마디로 표현하면 다음과 같다.
"텍스트 에디터 (Text Editor)로 열어서 읽을 수 있는 파일은 AI도 읽을 수 있다. 읽을 수 없는 파일은 변환 비용이 발생한다."
Markdown·CSV·YAML·JSON은 모두 텍스트 파일이다. 바이너리 (Binary) 형식인 Word나 Excel, PDF는 변환이 필요하다.
업무의 '입력'과 '작업' 단계는 플레인 텍스트 (Plain Text) 형식으로 다루고, '출력'과 '배포' 단계만 Word·PDF·Excel로 변환한다. 이 흐름으로 전환하는 것만으로도 AI와의 연계 비용은 대폭 낮아진다.
AI 자동 생성 콘텐츠
본 콘텐츠는 Qiita AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기