ChatGPT의 대화 기록을 일괄 저장하고 싶을 때 | 데이터 내보내기(Data Export)에서 당황했던 점과 원본 저장 방법 - Insights | Molayo

ChatGPT를 오래 사용하다 보면 과거의 대화가 조금씩 늘어납니다.

저의 경우, 업무상의 조사, 프로그램 개발, AI 도구 사용법, 웹사이트 운영, 문장 작성 등 다양한 내용을 ChatGPT에게 상담해 왔습니다.

대화가 늘어남에 따라 다음과 같은 문제들을 느끼게 되었습니다.

과거에 상담한 내용을 찾기 어려움
같은 것을 몇 번이고 반복해서 질문하게 됨
중요한 답변이 대화 기록 속에 묻힘
대화를 삭제하기 전에 필요한 정보를 남기고 싶음
1건씩 복사하는 것은 현실적이지 않음
향후 과거의 대화를 검색·재사용할 수 있도록 하고 싶음

그래서 **ChatGPT의 데이터 내보내기 (Data Export)**를 실시했습니다.

조작 자체는 어렵지 않았지만, 실제로 진행해 보니 다음과 같은 점에서 당황했습니다.

내보내기를 요청해도 데이터가 즉시 도착하지 않음
다운로드 링크의 유효기간이 24시간임
ZIP 파일이 예상보다 컸음
원본을 그대로 압축 해제하여 편집해도 되는지 알 수 없었음
저장소를 Dropbox와 GitHub 중 어디로 할지 고민됨
원본과 작업용 복사본을 어떻게 나눌지 고민됨
내보내기 후에 무엇을 해야 할지 알 수 없었음

이 기사에서는 ChatGPT의 데이터를 내보내는 절차와, 402건의 대화 데이터를 받았을 때 실제로 당황했던 점, 원본을 안전하게 저장하기 위해 결정한 운용 방법을 소개합니다.

이 기사는 다음과 같은 분들을 상정하고 있습니다.

ChatGPT의 과거 대화를 일괄 저장하고 싶다
대화가 늘어나 필요한 정보를 찾기 어려워졌다
채팅을 삭제하기 전에 백업하고 싶다
내보내기 후의 ZIP 파일 취급 방법을 모르겠다
원본을 망가뜨리지 않을까 불안하다
IT에 익숙하지 않아 어디에 저장해야 할지 고민이다
향후 대화를 분류·요약하여 재사용하고 싶다
개인정보나 업무 정보가 포함된 대화를 안전하게 정리하고 싶다

이번에는 내보내기를 요청하고, 취득한 원본을 저장하여 작업용 복사본을 준비하는 부분까지를 다룹니다.

이번 내보내기 결과는 다음과 같습니다.

항목	결과
내보내기 시작 메일	2026년 6월 8일 13:36
...

텍스트 중심의 데이터이므로 내보내기 파일은 그리 크지 않을 것이라고 생각했습니다.

하지만 실제 ZIP 파일은 약 92MB였습니다.

대화 기록뿐만 아니라 계정 관련 정보나 대화에서 사용한 파일 등이 포함되는 경우가 있기 때문에 예상보다 커질 수 있습니다.

내보내기 전에 저장 공간의 여유 용량을 확인해 두면 안심할 수 있습니다.

ChatGPT에는 과거의 대화 기록이나 계정과 관련된 데이터를 한꺼번에 다운로드하는 기능이 있습니다.

대화를 1건씩 복사할 필요는 없습니다.

내보내기를 요청하면 데이터 준비가 진행되며, 준비가 완료된 후 등록된 이메일 주소로 다운로드 안내가 도착합니다.

데이터는 ZIP 파일로 다운로드합니다.

화면 구성은 변경될 수 있지만, 이번에 사용한 Web 버전 ChatGPT에서는 다음과 같은 흐름으로 내보내기를 요청했습니다.

ChatGPT 로그인
↓
프로필 아이콘 열기
...

내보내기를 확정해도 그 자리에서 즉시 ZIP 파일이 다운로드되는 것은 아닙니다.

등록된 이메일 주소로 안내 메일이 도착합니다.

내보내기를 요청한 후, 처음에 다음 메일을 수신했습니다.

제목: 데이터 내보내기가 시작되었습니다
수신 일시: 2026년 6월 8일 13:36

이 시점에서는 아직 ZIP 파일을 다운로드할 수 없습니다.

내보내기 처리가 시작되었음을 알리는 메일입니다.

저는 내보내기를 요청하면 몇 분에서 몇십 분 정도면 데이터를 받을 수 있을 것이라고 생각했습니다.

하지만 바로 준비 완료 메일이 도착하지 않았습니다.

그래서 도중에 다음과 같은 점들을 몇 번이고 확인했습니다.

요청이 정상적으로 접수되었는가
다시 한번 내보내기를 요청하는 것이 좋은가
스팸 메일함에 들어있지는 않은가
등록된 이메일 주소가 맞는가
내보내기 처리에 실패한 것은 아닌가
대화 수가 많아서 시간이 걸리는 것인가

시작 메일이 도착했다면, 준비 완료 메일이 바로 도착하지 않더라도 우선은 처리 완료를 기다려야 합니다.

데이터 준비가 완료되었음을 알리는 메일은 다음 날 도착했습니다.

제목: 데이터 내보내기 준비가 완료되었습니다
수신 일시: 2026년 6월 9일 13:36

이번에 소요된 시간은 정확히 24시간이었습니다.

상황	일시
내보내기 시작 메일	2026년 6월 8일 13:36
...

이번 결과를 통해, 내보내기 (Export)는 요청 후 즉시 완료되지 않을 수도 있다는 것을 알게 되었습니다.

데이터 양이나 대화 수 등에 따라 준비에 시간이 걸릴 가능성이 있습니다.

동일한 조건이라도 매번 24시간이 걸리는 것은 아니지만, 적어도 "버튼을 누르면 몇 분 안에 다운로드할 수 있다"라고 생각하지 않는 편이 좋습니다.

내보내기에 관한 OpenAI의 도움말에는 다음과 같은 주의 사항이 있습니다.

You should receive an email with your data. Note: The link in the email expires after 24 hours.

한국어로 번역하면 다음과 같은 의미입니다.

데이터를 다운로드하기 위한 링크가 포함된 메일이 발송됩니다. 메일 내의 링크는 24시간 후에 만료되므로 주의가 필요합니다.

이 부분은 특히 주의가 필요합니다.

이번 과정에서는 데이터 준비에 24시간이 걸렸습니다.

한편, 준비 완료 메일에 기재된 다운로드 링크 또한 24시간 후에 만료됩니다.

내보내기 요청
↓
데이터 준비에 24시간 소요
...

즉, 다음과 같이 대응해야 합니다.

메일이 도착할 때까지 기다린다
메일이 도착하면 가급적 빨리 다운로드한다

준비 완료 메일을 놓치거나 링크의 유효 기간이 지나면, 다시 내보내기를 요청해야 할 수도 있습니다.

내보내기를 요청한 후에는 다음 장소들을 확인해 두면 안심할 수 있습니다.

받은 편지함
스팸 메일함
프로모션 등 자동 분류함
ChatGPT에 등록된 이메일 주소
메일 수신 일시

준비 완료 메일을 받으면 "나중에 다운로드해야지"라며 미루지 말고, 먼저 ZIP 파일을 저장하는 것을 추천합니다.

이번 내보내기 데이터에는 402건의 대화가 포함되어 있었습니다.

그 안에는 다음과 같은 내용들이 혼재되어 있었습니다.

업무 관련 상담
계약 및 견적 관련 내용
프로그램 개발
웹사이트 운영
AI 도구 사용법
개인적인 메모
개인 이름 및 회사명
업로드한 문장 및 파일
PC 환경 및 폴더 경로

따라서 취득한 ZIP 파일을 일반적인 기술 자료와 동일하게 취급하는 것은 피했습니다.

특히, 내보내기 원본을 그대로 GitHub에 저장하지는 않았습니다.

이번 원본은 Dropbox 내의 비공개 폴더에 저장했습니다.

이번에 다운로드한 ZIP 파일의 크기는 다음과 같았습니다.

91,975,102 바이트

대략 92MB입니다.

대화의 텍스트 데이터만을 상상했기에 예상보다 크다고 느꼈습니다.

파일 크기가 크면 다음과 같은 점에도 영향을 미칩니다.

저장 공간의 여유 용량
클라우드 스토리지 동기화 시간
복사에 걸리는 시간
ZIP 압축 해제 후 사용 용량
백업 대상의 용량
GitHub 등의 저장소에 적합한지 여부

ZIP 파일의 압축을 해제하면 원래의 ZIP 파일과는 별도로 압축 해제된 데이터도 저장됩니다.

따라서 적어도 다음 두 가지를 보관할 수 있는 용량이 필요합니다.

원본 ZIP
+
압축 해제 후의 작업용 데이터

나아가 분류 결과나 요약 파일을 만드는 경우에는 해당 저장 용량도 필요하게 됩니다.

ZIP 파일을 받은 후, 저는 다음과 같은 점들 사이에서 고민했습니다.

ZIP 파일을 그대로 압축 해제해도 되는가
압축 해제 후 원래의 ZIP을 삭제해도 되는가
ZIP 내부의 파일을 직접 편집해도 되는가
작업 도중 파일을 손상했을 경우, 되돌릴 수 있는가
원본과 작업용 파일을 같은 장소에 두어도 되는가
정리된 파일을 어디에 저장해야 하는가

최종적으로는 다음과 같은 규칙을 세웠습니다.

다운로드한 ZIP 파일은 원본으로 저장하고,

원본을 직접 편집하지 않는다.

정리 작업 시에는 원본 ZIP을 별도의 폴더에 압축 해제하며, 압축 해제된 파일을 작업용 복사본으로 사용한다.

원본 ZIP
↓
별도 폴더로 압축 해제
...

이 방법이라면 작업 도중 문제가 발생하더라도 원본으로부터 다시 시작할 수 있습니다.

이번에 최종적으로 다음과 같이 3단계로 나누었습니다.

00_Raw_Exports
원본 보관용
01_Extracted
...

폴더 구성의 예는 다음과 같습니다.

Kinoto_Knowledge_Base_Archive
├─ 00_Raw_Exports
│ └─ ChatGPT
...

각각의 역할은 다음과 같습니다.

폴더	용도	원칙
`00_Raw_Exports`	다운로드한 원본	원칙적으로 변경하지 않음
`01_Extracted`	전개·확인·분류	작업용으로 사용
`02_Summaries`	요약·정리 후의 결과물	재사용할 정보를 저장

이 구분을 결정하기 전까지, 어떤 파일을 건드려도 되는지 몇 번이나 확인했습니다.

하지만 처음에 원본과 작업용을 나누어 두니, 이후 작업이 훨씬 수월해졌습니다.

이번에 진행한 흐름은 다음과 같습니다.

준비 완료 메일 수신
↓
24시간 이내에 ZIP 다운로드
...

다운로드 폴더에 그대로 두면, 다른 파일과 섞이거나 실수로 삭제할 가능성이 있습니다.

따라서 다운로드가 완료된 단계에서 정식 저장 장소로 옮기기로 했습니다.

이번에 저장된 ZIP 파일의 이름은 다음과 같았습니다.

2026-06-08_chatgpt_export.zip.zip

반면, PowerShell에서는 다음과 같은 이름을 전제로 복사나 전개(Extraction)를 수행하려 했습니다.

2026-06-08_chatgpt_export.zip

그 결과, 지정한 경로에 파일이 존재하지 않는다는 결과가 나왔습니다.

예상한 이름:
2026-06-08_chatgpt_export.zip
실제 이름:
...

원인은 확장자가 이중으로 되어 있었기 때문입니다.

이런 경우에는 명령어를 반복하기 전에 실제 파일명을 확인합니다.

Get-ChildItem "원본을 저장한 폴더의 경로"

파일명 확인 후, 알기 쉬운 이름으로 변경했습니다.

변경 전:
2026-06-08_chatgpt_export.zip.zip
변경 후:
...

에스플로러(Explorer)에서 확장자가 숨겨져 있는 경우, 겉모습만으로는 .zip.zip임을 알아차리기 어려울 수 있습니다.

PowerShell에서 실제 파일명을 확인하면 원인을 파악하기 쉬워집니다.

PowerShell을 사용할 경우, Expand-Archive로 ZIP 파일을 전개할 수 있습니다.

다음은 일반화한 예시입니다.

$sourceZip = "C:\Users\<사용자명>\Dropbox\Knowledge_Base\00_Raw_Exports\ChatGPT\2026-06-08_chatgpt_export.zip"
$destination = "C:\Users\<사용자명>\Dropbox\Knowledge_Base\01_Extracted\ChatGPT\2026-06-08_chatgpt_export"
Expand-Archive `
...

전개 후에는 지정한 폴더가 생성되었는지 확인합니다.

Test-Path $destination

결과가 다음과 같이 나오면 폴더가 존재하는 것입니다.

True

이 글에서는 일반화를 위해 사용자명 등 개인정보를 포함한 실제 경로는 게시하지 않았습니다.

전개한 폴더에는 대화 기록이나 계정과 관련된 데이터가 포함되어 있었습니다.

대화 정리에서 특히 중요했던 파일은 다음과 같습니다.

conversations.json

conversations.json에는 ChatGPT의 대화 데이터가 JSON 형식으로 저장되어 있습니다.

또한, 브라우저에서 대화 내용을 확인하기 쉬운 파일로 다음 파일도 포함되어 있었습니다.

chat.html

이번 용도에서는 다음과 같이 구분하여 사용했습니다.

파일	주요 용도
`chat.html`	브라우저에서 대화 내용을 확인한다
`conversations.json`	프로그램으로 대화 목록이나 인덱스를 만든다
기타 파일	계정 정보나 첨부 데이터 등을 확인한다

처음에는 어떤 파일을 봐야 할지 알 수 없었습니다.

대화를 눈으로 직접 읽을 경우에는 chat.html

가 이해하기 쉬웠고, 대화를 목록화·분류할 경우에는 conversations.json

이 중요했습니다.

이번 내보내기(Export)에는 402건의 대화가 포함되어 있었습니다.

이 건수를 보고, 1건씩 수작업으로 복사하여 분류하는 방법은 현실적이지 않다고 판단했습니다.

실제로는 다음과 같은 문제들이 있었습니다.

제목만으로는 내용을 알 수 없음
동일한 테마의 대화가 여러 개 있음
하나의 대화에 여러 테마가 포함됨
업무 정보와 개인 정보가 혼재되어 있음
공개 가능한 내용과 비공개 정보가 혼재되어 있음
오래된 결론과 새로운 결론이 동시에 남아 있음
긴 대화는 내용 확인에 시간이 걸림

그래서 다음 단계에서는 conversations.json

에서 대화 제목이나 일시를 추출하여, CSV 형식의 인덱스(Index)를 만들기로 했습니다.

저는 정리된 Markdown 파일이나 작성한 스크립트를 GitHub의 Private 리포지토리(Repository)에서 관리하고 있습니다.

단, ChatGPT의 내보내기 원본은 GitHub에 저장하지 않았습니다.

내보내기 데이터에는 다음과 같은 정보가 포함될 가능성이 있기 때문입니다.

성명
회사명
고객 정보
메일 본문
계약 조건
업무상 상담 내용
개인적인 내용
업로드한 파일
PC 환경 및 폴더 경로
공개를 상정하지 않은 대화

Private 리포지토리라 하더라도, 조작 실수나 설정 변경의 가능성을 완전히 배제할 수 없습니다.

따라서 저장소의 역할을 다음과 같이 나누었습니다.

저장소	저장하는 것
Dropbox	원본, 기밀 정보, 전개 후의 작업용 데이터
...

원본과 공개 가능한 지식을 분리함으로써, 오공개 리스크를 낮출 수 있습니다.

2026년 6월 8일 13:36에 내보내기 시작 메일을 받았고, 준비 완료 메일이 도착한 것은 다음 날인 2026년 6월 9일 13:36이었습니다.

이번에는 실제로 다운로드할 수 있게 되기까지 정확히 24시간이 걸렸습니다.

데이터 준비에는 24시간이 걸린 반면, 준비 완료 메일 내의 다운로드 링크도 24시간 후에 만료됩니다.

따라서 다음과 같은 대응이 필요했습니다.

메일이 도착할 때까지 기다린다
메일이 도착하면 빠르게 다운로드한다

텍스트 중심일 것이라고 생각했지만, ZIP 파일은 약 92MB였습니다.

원본과 전개 후의 데이터를 모두 저장해야 하므로, 저장소 용량에도 주의가 필요했습니다.

다운로드 폴더, Dropbox, GitHub 중 어디에 저장해야 할지 고민했습니다.

최종적으로 원본과 기밀 정보는 Dropbox에 저장하기로 했습니다.

원본 ZIP은 변경하지 않고 저장하고, 별도의 폴더에 전개한 작업용 복사본을 사용하기로 했습니다.

파일명이 .zip.zip

으로 되어 있어서 PowerShell에서 지정한 경로와 일치하지 않았습니다.

데이터를 취득하더라도, 402건의 대화를 어떻게 분류하고 어떻게 재사용할지는 별개의 과제였습니다.

ChatGPT에 등록된 이메일 주소를 확인한다
메일을 수신할 수 있는지 확인한다
저장소의 여유 용량을 확인한다
원본 저장 장소를 결정한다
개인 정보나 업무 정보가 포함되어 있다는 전제로 생각한다
내보내기 시작 메일을 확인한다
수신함을 정기적으로 확인한다
스팸 메일함도 확인한다
바로 도착하지 않더라도 시작 메일이 도착했다면 기다린다
불필요하게 여러 번 요청하지 않는다
24시간 이내에 다운로드한다
파일명을 확인한다
확장자가 이중으로 되어 있지 않은지 확인한다
파일 크기를 확인한다
정식 원본 보관 장소로 이동한다
원본 ZIP을 직접 편집하지 않는다
원본을 삭제하지 않는다
별도의 작업용 폴더에 전개한다
원본, 작업용 데이터, 정리 결과를 분리한다
원본을 그대로 GitHub에 넣지 않는다
기밀 정보를 포함하고 있다는 전제로 다룬다

이번 내보내기는 단순한 백업으로 끝나지 않았습니다.

그 후, 다음과 같은 흐름으로 정리를 진행했습니다.

ChatGPT 데이터 내보내기
↓
원본 ZIP을 Dropbox에 저장
...

ChatGPT의 데이터를 취득하는 것과, 검색·재사용하기 쉬운 지식으로 정리하는 것은 별개의 작업입니다.

내보내기는 개인 지식 베이스(Knowledge Base)를 만들기 위한 첫 번째 입구가 되었습니다.

기사가 완성되는 대로 순차적으로 공개할 예정입니다.

ChatGPT의 내보내기 데이터를 안전하게 저장하기

conversations.json

에서 402건의 대화 목록 만들기

ChatGPT의 대화 기록을 카테고리별로 정리하기

기밀 정보를 분류하여 마스킹 (Masking) 하기
마스킹한 문장을 AI로 요약하기
대화 기록을 Markdown으로 정리하기
Dropbox와 GitHub를 구분하여 사용하기
개인 지식 베이스 (Knowledge Base)로 운영하기
RAG (Retrieval-Augmented Generation)로 재사용하기 위한 준비하기

ChatGPT의 데이터 내보내기 (Data Export)는 설정 화면에서 요청할 수 있습니다.

하지만 실제로 해보니, 내보내기 버튼을 누르는 것보다 데이터가 도착하기까지 걸리는 시간과 그 이후의 파일 관리에서 당황했습니다.

이번에 내보내기 시작 메일을 받은 것은 2026년 6월 8일 13:36이었고, 준비 완료 메일을 받은 것은 다음 날인 2026년 6월 9일 13:36이었습니다.

데이터를 다운로드할 수 있게 되기까지 정확히 24시간이 걸렸습니다.

게다가, 준비 완료 메일 내의 다운로드 링크는 24시간 후에 만료됩니다.

이번에 특히 중요했던 점은 다음 4가지입니다.

내보내기 데이터는 요청 후 즉시 준비되지 않을 수도 있다
준비 완료 메일의 링크는 24시간 후에 만료된다
원본은 직접 편집하지 말고 작업용 복사본을 만든다
원본에는 기밀 정보가 포함되어 있다는 전제하에 저장 장소를 결정한다

저의 경우, 내보낸 ZIP 파일에는 402건의 대화가 포함되어 있었으며, 크기는 약 92MB였습니다.

원본을 Dropbox에 저장하고, 별도의 폴더에 압축을 푼 작업용 복사본을 사용하여 이후의 분류 및 요약을 진행했습니다.

처음부터 완벽한 지식 베이스 (Knowledge Base)를 만들 필요는 없습니다.

우선 기한 내에 데이터를 다운로드하고, 원본을 안전하게 저장하여 언제든 다시 시작할 수 있는 상태를 만드는 것이 첫걸음이었습니다.

ChatGPT의 대화 기록을 일괄 저장하고 싶을 때 | 데이터 내보내기(Data Export)에서 당황했던 점과 원본 저장 방법

요약

핵심 포인트

댓글