본문으로 건너뛰기

© 2026 Molayo

Zenn헤드라인2026. 06. 24. 21:20

AI 모델의 '상태 조사서'──Gen AI Archive를 통해 본 모델 보존과 질감 LoRA 아카이브의 공통 구조

요약

AI 모델의 행동 패턴을 특정 시점의 스냅샷으로 기록하는 'Gen AI Archive' 프로젝트를 소개합니다. 미술 박물관의 '상태 조사서' 방법론을 빌려, 모델의 내부를 수정하지 않고 외부 관측을 통해 모델의 상태를 보존하는 구조적 유사성을 분석합니다.

핵심 포인트

  • Gen AI Archive는 모델의 응답 패턴을 스냅샷 형태로 저장하여 모델의 행동을 기록함
  • 미술 박물관의 '상태 조사서'처럼 모델의 내부를 건드리지 않는 외부 관측 방식 채택
  • LoRA 보존을 위해 가중치뿐만 아니라 학습 조건 및 실행 환경 정보가 필수적임
  • 모델 업데이트 및 생태계 변화로 인한 AI 모델의 소멸 리스크 대응 필요

서론──사라져가는 AI 모델

2022년에 출시된 초기 이미지 생성 모델을 지금 그대로 실행할 수 있을까?

GPT-3의 오리지널 버전, Google Bard의 초기 버전, Stable Diffusion 1.4의 기본 출력──이들은 모두 당시의 상태를 그대로 재현하는 것이 거의 불가능해졌다. 기업은 모델을 업데이트하고 구버전을 조용히 은퇴시킨다. "어느 시점에 AI가 어떻게 행동했는가"에 대한 기록은 거의 남지 않는다.

본 기사에서는 AI 모델의 보존을 목표로 하는 "Gen AI Archive" 프로젝트와 미술 박물관학에서의 "상태 조사서 (condition report)"의 구조적 유사성을 분석하고, LoRA 파일의 장기 보존에 대해 고찰한다.

Gen AI Archive란

2026년 5월, 스위스 장크트갈렌에 비영리 재단 "Internet Archive Switzerland"가 설립되었다. 그 프로젝트 중 하나가 Gen AI Archive다.

수행 내용

장크트갈렌 대학교의 Damian Borth 교수와 협력하여, 생성 AI 모델의 "행동"을 특정 시점의 스냅샷으로서 저장하고 있다.

기록 대상:

항목내용
응답 패턴특정 질문에 대한 답변 기록
...

Llama-3의 파생 버전 등 소멸 리스크가 있었던 오픈 웨이트 (open weights) 모델 (가중치가 공개되어 있어 누구나 실행할 수 있는 타입)도 포함된다.

Git과의 차이

"버전 관리 도구와 무엇이 다른가"라는 의문이 생긴다.

Git은 개발자가 스스로 의도적으로 차이(diff)를 남겨가는 메커니즘이다. Gen AI Archive는 다르다. 내용물이 비공개인 모델을 외부에서 정점 관측한다.

내용물은 보이지 않는다. 하지만 "이 시점에는 이렇게 행동했다"를 외부에서 기록해 나간다.

박물관학의 "상태 조사서"와의 구조적 유사성

미술 박물관에서는 소장품의 보존을 위해 **상태 조사서 (condition report)**라는 문서를 사용한다.

상태 조사서란

작품을 수용할 때, 대여할 때, 정기 점검 시에 작성되는 기록으로 다음을 포함한다:

표면 상태: 균열, 박락, 변색, 오손의 유무와 위치 -
구조적 안정성: 지지체 (캔버스, 패널)의 왜곡, 접합부의 상태 -
과거 수복 이력: 언제, 누가, 무엇을 수행했는지에 대한 이력 -
환경 조건: 기록 시의 온습도, 조도

중요한 점은, 작품의 내부 구조를 바꾸지 않고 외부에서 관찰한 상태를 기록한다는 점이다.

병렬 비교

상태 조사서 (미술)Gen AI Archive
대상물리적 작품
...

둘 다 "대상의 내부를 바꾸지 않고 외부에서 상태를 계속 기록한다"라는 동일한 방법론에 입각해 있다.

질감 LoRA 아카이브에 대한 시사점

LoRA 파일의 소멸 리스크

현재 SDXL 1.0으로 학습한 LoRA가 5년 후에도 동일하게 작동한다는 보장은 없다.

리스크 요인:
├── 베이스 모델의 비호환 업데이트
├── 추론 엔진 (inference engine)의 사양 변경
...

모델이나 도구의 생태계가 변하면 출력은 변한다. LoRA의 가중치 파일 (.safetensors)만 저장해도, 재현에 필요한 환경 정보가 상실되면 의미가 없다.

질감 LoRA에 필요한 "상태 조사서"

질감 LoRA──일본 전통 소재 (금박, 나전, 암채색 등)의 물리적 표면 특성을 모델에 학습시킨 LoRA──를 장기 보존하기 위해서는 다음과 같은 정보 세트가 필요하다:

# 질감 LoRA 상태 조사서 (예시)
lora_id: SHIFUKU_kinpaku_v1
created: 2026-06-01
...

LoRA의 가중치뿐만 아니라 학습 조건, 원재료의 물리적 특성, 출력 샘플과 그 해시(hash), 실행 환경──이것들을 한 세트로 저장함으로써 비로소 "재현 가능한 아카이브"가 된다.

요약──"보존하고 검증하는" 시대로

Gen AI Archive는 AI를 "사용"하기만 하는 시대에서 "보존하고 검증하는" 시대로의 이행을 보여준다. 질감 LoRA 연구가 회화를 "감상"하는 것뿐만 아니라 "디지털 자산으로서 정착시키는" 방향으로 나아가고 있는 것과 같은 벡터다.

그리고 이 "보존과 검증"을 실용적으로 구현하는 것이, 생성물의 이력 정보를 블록체인에 기록하는 AI와지훈군 (AI和指紋くん)의 접근 방식이다.

LoRA의 학습 조건, 사용 모델, 생성 파라미터(parameter)──이러한 "상태 조사서"를 블록체인 위에 새김으로써, 나중에 검증 가능한 형태로 성과물을 남길 수 있다. 미술 박물관의 내력(provenance) 기록이 디지털 시대에 확장된 모습이라고 할 수 있다.

만든 것이 사라지지 않게 한다. 나중에 되돌아볼 수 있게 한다. 그 대상이 캔버스에서 AI 모델까지 확장된 시대의 구현 수단이 여기에 있다.

Discussion

AI 자동 생성 콘텐츠

본 콘텐츠는 Zenn AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0