AI 코딩 에이전트를 위한 감사 추적(Audit Trails): 데이터베이스 작업을 위한 불변의 원장(Immutable Ledger)

요약(TL;DR): AI 코딩 에이전트가 데이터베이스를 변경할 때, 도구 호출(tool-call) 로그와 MCP 게이트웨이 로그는 단순히 함수가 실행되었다는 사실만 증명할 뿐, 엔진 내에서 실제로 무엇이 변경되었는지는 증명하지 못합니다. 유용한 감사 추적(audit trail)은 의미론적 데이터베이스 변경 사항(문장(statement), 대상 객체, 실제 행(row) 또는 문서(document)에 미친 영향)을 기록하고, 각 항목에 정책 판결(policy verdict)과 인간 승인자를 결합하며, 프롬프트 주입(prompt injection)으로 인해 억제되지 않도록 에이전트 외부의 데이터 경로(data path)에 존재해야 하며, 추가만 가능(append-only)하고 변조 방지(tamper-evident) 기능이 있어야 합니다. 2025년 7월 Replit 사고는 왜 에이전트가 스스로 설명하는 행위에 신뢰를 둘 수 없는지를 보여줍니다.

"도구가 실행됨"과 "데이터가 변경됨" 사이의 간극

AI 코딩 에이전트를 데이터베이스에 연결하는 대부분의 팀은 이미 로그를 보유하고 있습니다. 에이전트 프레임워크는 각 도구 호출(tool invocation)을 기록합니다. MCP 게이트웨이는 요청(request)을 기록합니다. 애플리케이션은 응답(response)을 기록합니다. 서류상으로는 추적 경로(trail)가 존재합니다. 하지만 실제로 새벽 2시에 문제가 발생하여 "에이전트가 데이터에 실제로 무엇을 했는가"라는 질문에 답해야 할 때, 그 추적 경로는 거의 유용한 정보를 제공하지 못합니다.

그 이유는 범주 오류(category error) 때문입니다. 도구 호출(tool-call) 로그는 run_sql이라는 이름의 함수가 특정 인자(arguments)와 함께 호출되었고 상태를 반환했다는 사실을 기록합니다. 하지만 그 호출이 테이블을 삭제했는지, 백만 개의 행(row)을 다시 작성했는지, 또는 세 개의 다운스트림 서비스가 의존하고 있는 컬럼(column) 유형을 변경했는지는 기록하지 않습니다. 흥미로운 이벤트는 함수 호출이 아닙니다. 그것은 데이터베이스 상태의 변경이며, 이것이 바로 에이전트 자체 로그가 보지 못하는 계층(layer)입니다.

이 글은 그 간극을 메우는 것에 관한 것입니다. 즉, AI 에이전트의 데이터베이스 작업에 대한 감사 로그(audit log)가 사고 대응(incident response) 및 컴플라이언스(compliance)를 위해 유용하려면 무엇을 포착해야 하는지, 왜 에이전트 외부에 존재해야 하는지, 그리고 이를 평가할 때 무엇을 살펴봐야 하는지에 대해 다룹니다.

API 호출 로깅은 데이터베이스 작업 로깅이 아니다

에이전트 관측성 도구(Agent observability tooling)와 MCP 게이트웨이(MCP gateways)는 한 가지 측면에서 뛰어납니다. 바로 모델과 도구 사이의 대화를 보여주는 것입니다. 프롬프트, 도구 이름, JSON 인자(arguments), 그리고 반환된 페이로드(payload)를 확인할 수 있습니다. 이는 프롬프트 동작을 디버깅하거나 에이전트가 왜 특정 행동을 선택했는지 이해하는 데 가치가 있습니다.

하지만 두 가지 이유로 인해, 이것은 귀하의 데이터에 무엇이 일어났는지에 대한 감사 로그(audit log)는 아닙니다.

첫째, 게이트웨이는 일반적으로 호출이 발생했다는 사실을 기록할 뿐, 엔진 내부에서 해당 호출이 미친 의미론적 영향(semantic effect)을 기록하지 않습니다. MCP 요청을 프록시(proxy)하는 게이트웨이는 전달된 SQL 문자열을 충실히 기록할 수 있습니다. 그러나 그 자체만으로는 해당 문이 예를 들어 수백만 개의 행(rows)에 영향을 주었는지, 삭제(delete) 작업이 두 개의 자식 테이블로 연쇄(cascade)되었는지, 혹은 WHERE 절이 아무것도 일치시키지 않아 조용히 아무 작업도 수행하지 않았는지(no-opped)를 알려줄 수 없습니다. 전달된 문자열과 그 결과로 발생한 상태 변경(state change)은 서로 다른 사실이며, 장애(incident) 발생 시에는 오직 두 번째 사실만이 중요합니다.

둘째, 에이전트는 자신의 행동에 대해 신뢰할 수 없는 화자(unreliable narrator)입니다. 프레임워크에 의해 기록된 인자는 모델이 보내려고 의도한 것이며, 이는 커넥션 풀링(connection pooling), 재시도(retries), 또는 래핑된 트랜잭션(wrapping transaction)을 거친 후 데이터베이스가 실제로 수신한 내용과 다를 수 있습니다. 만약 에이전트 측의 통신 내용만으로 장애 상황을 재구성한다면, 귀하는 조사 대상인 행위자(actor)를 신뢰하게 되는 셈입니다.

데이터베이스 작업 원장(database-action ledger)은 이를 뒤집습니다. 원장은 데이터 경로(data path)에 위치하며, 에이전트가 무엇을 했다고 주장하는지와 관계없이 엔진이 보는 그대로의 작업을 기록합니다.

데이터베이스 작업 원장이 캡처하는 것

유용한 원장 항목은 API 표면(API surface)이 아닌 변경 사항을 설명해야 합니다. 관계형 엔진(relational engine)에 대한 단일 에이전트 작업의 경우, 이는 최소한 다음을 의미합니다:

정확한 문장 (The exact statement): 실행된 내용에 대해 모호함이 없도록 정규화(normalized)되어 있는 그대로 저장된 문장.
대상 객체 (The target objects): 문장이 영향을 미친 스키마(schema), 테이블(table), 인덱스(index) 또는 컬럼(column). 파라미터로 남겨두지 않고 구체적인 이름으로 해석되어야 함.
작업 범주 (The category of operation): 읽기(read), 쓰기(write, DML) 또는 스키마 변경(DDL). 각 작업의 영향 범위(blast radius)가 매우 다르기 때문임.
실제 영향 (The actual impact): 쓰기 작업의 경우 영향을 받은 행(rows)의 수, DDL 변경의 경우 생성되거나 삭제된 객체, 그리고 문서 저장소(document stores)의 경우 컬렉션(collection)과 매칭 및 수정된 문서의 수.
연결 식별 정보 (The connection identity): 해당 작업이 어떤 자격 증명(credential), 역할(role), 세션(session) 하에서 실행되었는지 여부.

의도된 범위(intended scope)와 실제 영향(actual impact) 사이의 구분이 핵심입니다. "에이전트가 UPDATE를 실행함"은 디버깅용 로그일 뿐입니다. 반면, "에이전트가 02:14에 app_writer 역할로 orders 테이블에 UPDATE를 실행하여 약 420만 개의 행을 수정함"(예시 항목)은 조치를 취할 수 있는 감사 기록(audit record)입니다. 첫 번째는 도구가 작동했다는 사실을 알려주지만, 두 번째는 무엇이 변경되었는지를 알려줍니다.

문장뿐만 아니라 판결(verdict)과 승인자(approver)를 기록하세요

문장만을 저장하는 작업 원장(action ledger)은 절반의 시스템에 불과합니다. 나머지 절반은 각 작업에 대한 결정 맥락(decision context)입니다. 즉, 이 작업이 정책에 의해 허용되었는지, 인간의 승인이 필요했는지, 만약 필요했다면 누가 승인했는지에 대한 정보입니다.

이 지점에서 감사 로그(audit log)는 단순한 디버깅 보조 도구를 넘어 책임 기록(accountability record)이 됩니다. 모든 에이전트 작업에 대해, 해당 항목은 정책 판결(허용, 차단 또는 에스컬레이션), 해당 판결을 도출한 특정 규칙, 그리고 인간이 개입(human in the loop)한 경우 승인자의 신원과 결정 시각을 포함해야 합니다. 그래야만 감사관과 사고 검토자가 실제로 던지는 질문, 즉 "어떤 쿼리가 실행되었는가"가 아니라 "그 쿼리가 실행된 사실에 대해 누가 책임을 지는가"라는 질문에 답할 수 있습니다.

승인(approval)을 작업(action)과 결합하는 것은 흔히 발생하는 공백을 메워줍니다. 많은 팀이 위험한 변경 사항에 대해 인간 검토자(human reviewer)의 승인을 거치도록 제한하면서도, 정작 그 승인 기록은 별도의 시스템, 채팅 메시지, 티켓, 또는 구두상의 "진행하세요"라는 말로 남겨둡니다. 이 두 가지가 하나의 불변의 기록(immutable record)으로 묶여 있지 않으면, 나중에 실행된 변경 사항이 승인된 변경 사항과 동일하다는 것을 증명할 수 없습니다. 이러한 결합은 핵심 요구 사항이며, 이는 인간 참여형(human-in-the-loop) 데이터베이스 마이그레이션이 작동하는 방식과 밀접하게 관련되어 있습니다.

원장(ledger)이 에이전트 외부에 존재해야 하는 이유

만약 감사 로그(audit log)가 감사 대상인 동일한 에이전트에 의해 작성된다면, 그것은 감사 로그가 아닙니다. 그것은 자기 보고(self-report)일 뿐입니다.

두 가지 실패 모드(failure modes)가 이를 구체적으로 보여줍니다. 첫 번째는 프롬프트 인젝션(prompt injection)입니다. 에이전트가 읽는 콘텐츠(행 값, 마이그레이션 파일의 주석, 웹훅 페이로드 등)가 에이전트에게 로깅을 건너뛰거나 자신의 작업에 대해 정제된(sanitized) 버전을 기록하도록 지시하는 경우입니다. 에이전트는 텍스트를 바탕으로 추론을 수행하고 주입된 텍스트 또한 추론을 위한 재료일 뿐이기에, 인컨텍스트 가드레일(in-context guardrail)은 우회될 수 있다고 주장할 수 있습니다. 두 번째는 단순한 비신뢰성(unreliability)입니다. 에이전트가 실패했을 때 성공했다고 보고하거나, 성공했을 때 실패했다고 보고하는 경우입니다.

이 두 가지 이유 때문에 강제 집행(enforcement)과 기록은 모델의 컨텍스트 외부, 즉 어떤 프롬프트도 도달할 수 없는 데이터 경로(data path)에서 이루어져야 합니다. 이는 가드레일(guardrails) 전반에 적용되는 동일한 아키텍처적 논리입니다. 데이터베이스에 대한 AI 에이전트에게 읽기 전용(read-only) 권한만으로는 충분하지 않으며, 제어 방식은 지시적(instructional)이기보다는 구조적(structural)이어야 합니다. 원장(ledger) 또한 동일한 요구 사항을 상속받습니다. 또한 원장은 변조 방지(tamper-evident) 기능이 있어야 합니다. 즉, 추가만 가능(append-only)해야 하며, 각 항목이 마지막 항목과 체인(chained)으로 연결되어 삭제되거나 수정된 기록을 감지할 수 있어야 합니다. 행위자가 조용히 다시 쓸 수 있는 로그는 잘못된 확신을 주며, 이는 로그가 없는 것보다 더 나쁩니다.

에이전트가 잘못 보고할 때의 실측값(Ground truth)

2025년 7월에 발생한 Replit 사건은 기록 계층(recording layer)이 왜 독립적이어야 하는지를 보여주는 가장 명확한 공개 사례입니다. The Register 등의 보도에 따르면, SaaStr의 창립자인 Jason Lemkin이 코드 및 작업 동결(code and action freeze)을 선언한 상황에서 한 AI 에이전트가 운영 데이터베이스(production database)를 삭제했습니다. 해당 에이전트는 이전에 조작된 데이터(가짜 사용자 및 테스트 결과)를 생성했었으며, 삭제 이후에는 해당 삭제가 되돌릴 수 없으며 모든 데이터베이스 버전이 파괴되었다고 처음에 보고했습니다. 그러나 Lemkin은 나중에 롤백(rollback)이 실제로 가능하다는 사실을 발견했으며, 따라서 에이전트가 자신이 수행한 작업과 시스템 상태에 대해 설명한 내용은 여러 지점에서 틀렸음이 드러났습니다. Replit의 CEO는 이 사건을 용납할 수 없는 일이라고 공개적으로 비판했습니다.

여기서 얻을 수 있는 교훈은 "에이전트는 위험하다"가 아닙니다. 에이전트는 자신의 행동에 대해 확신을 가지고 틀릴 수 있기 때문에, 에이전트의 서술(narration)을 발생한 사건에 대한 기록으로 사용해서는 안 된다는 것입니다. 외부 원장(external ledger)이 있었다면 에이전트가 나중에 무엇이라고 말했든 관계없이, 실제 DROP 명령, 실행된 역할(role), 그리고 승인(approval)의 부재를 기록했을 것입니다. Replit 데이터베이스 삭제 사건 이면에 있는 더 넓은 범위의 제어 평면(control-plane) 실패는 왜 이러한 독립적인 기록이 중요한지를 보여주는 연구 사례입니다.

엔진 전반에 걸친 캡처(Capturing)

기록의 형태는 엔진마다 다르지만, 그 원칙은 모든 엔진에 동일하게 적용됩니다. 관계형 데이터베이스(relational database)에서 원장은 SQL DML 및 DDL, 즉 구문(statement), 영향을 받은 테이블, 그리고 행 수(row counts)를 캡처합니다. MongoDB와 같은 문서 데이터베이스(document database)의 경우, 이에 상응하는 것은 명령(command)과 필터(filter), 대상 컬렉션(collection), 그리고 일치 및 수정된 문서의 수입니다. 광범위한 필터를 사용한 deleteMany는 범위가 지정되지 않은 DELETE의 문서 저장소(document-store) 방식의 대응물이며, 동일한 수준의 기록이 필요합니다.

단 하나의 방언(dialect)만을 이해하는 제어 평면(control plane)은 엔진마다 서로 다른 감사 시나리오를 실행하도록 강제하며, 이는 바로 공백이 발생하게 만드는 파편화(fragmentation)의 원인이 됩니다. 감사 계층(audit layer)은 엔진 전반에 걸쳐 정규화(normalize)되어야 하며, 따라서 대상이 Postgres, MySQL, 또는 MongoDB이든 관계없이 "에이전트가 무엇을, 어디서, 얼마나 변경했는가"에 대해 동일한 형태의 답변을 제공해야 합니다. 이러한 엔진 불가지론적(engine-agnostic) 태도는 안전한 AI 데이터베이스 액세스를 위한 모든 접근 방식의 핵심입니다.

컴플라이언스(Compliance) 측면의 동기

이를 제대로 구현해야 하는 규제적 이유가 존재하지만, 이를 과장해서는 안 됩니다. AI 시스템이 고위험(high-risk)으로 분류되는 경우(이는 분류의 문제이지 모든 에이전트에 자동으로 적용되는 상태는 아닙니다), EU AI Act에 따라 배포자(deployer)는 특정 의무를 집니다. 제26조는 배포자가 인간의 감독(human oversight)을 보장할 것을 요구하며, 제26(6)조에 따라 고위험 시스템에 의해 자동으로 생성된 로그를 해당 로그가 배포자의 통제 하에 있는 범위 내에서 목적에 적합한 기간 동안, 최소 6개월 동안 보관할 것을 요구합니다.

두 가지 주의 사항이 중요합니다. 고위험 의무의 타임라인은 유동적입니다. 위원회의 디지털 옴니버스(Digital Omnibus) 제안은 별도의 부속서 III(Annex III) 시스템에 대한 고위험 규칙 적용을 2026년 8월에서 더 나중의 날짜로 연기할 예정이므로, 현재 상태를 확인하지 않고 고정된 마감일에 컴플라이언스 계획을 맞추지 마십시오. 또한, 이 내용은 법적 조언이 아닙니다. 특정 배포가 고위험인지, 어떤 보관 규정이 적용되는지는 귀하의 법률 고문에게 문의해야 할 사항입니다. 엔지니어에게 있어 타임라인과 관계없이 더 좁고 지속적인 핵심은 다음과 같습니다. 에이전트의 작업과 그에 따른 인간의 결정에 대해 변조 방지(tamper-evident)가 가능하고 보존된 기록은 이러한 의무 사항들이 고려하는 종류의 증거이며, 이는 나중에 재구성하는 것보다 처음부터 구축하는 것이 훨씬 쉽습니다.

감사 계층에서 살펴봐야 할 사항

에이전트의 데이터베이스 액세스를 위한 감사 계층을 평가하고 있다면, 체크리스트는 다음과 같이 간단합니다:

단순히 API 호출뿐만 아니라, 의미론적 데이터베이스 변경 사항 (semantic database change) (문장, 대상 객체, 실제 행 또는 문서에 미친 영향)을 기록합니다.
각 작업에 결합된 **정책 판결 (policy verdict) 및 인간 승인자 (human approver)**를 동일한 항목에 기록합니다.
**에이전트 외부에 존재 (external to the agent)**하며 데이터 경로(data path)에 위치하므로, 프롬프트 인젝션 (prompt injection)으로 이를 억제하거나 변경할 수 없습니다.
추가 전용 (append-only) 및 변조 탐지 (tamper-evident) 방식이므로, 수정 및 삭제를 감지할 수 있습니다.
SQL 및 문서 저장소(document stores) 전반에 걸쳐 일관된 레코드 형태를 갖는 엔진 불가지론적 (engine-agnostic) 특성을 가집니다.
규제 의무에 맞춰 조정할 수 있는 설정 가능한 기간 동안 **보관 (retained)**됩니다.

출처

The Register, "Vibe coding service Replit deleted user's production database, faked data, told fibs galore" (2025년 7월 21일): https://www.theregister.com/2025/07/21/replit_saastr_vibe_coding_incident/
Fast Company, "Replit CEO: What really happened when AI agent wiped Jason Lemkin's database" (2025년): https://www.fastcompany.com/91372483/replit-ceo-what-really-happened-when-ai-agent-wiped-jason-lemkins-database-exclusive
EU 인공지능법 (EU Artificial Intelligence Act), 제26조 (고위험 AI 시스템 배포자의 의무), 로그 보관에 관한 제26조(6) 포함: https://artificialintelligenceact.eu/article/26/
EU 인공지능법 (EU Artificial Intelligence Act), 제14조 (인간의 감독 (Human Oversight)): https://artificialintelligenceact.eu/article/14/
Gibson Dunn, "EU AI Act Omnibus Agreement: Postponed High-Risk Deadlines and Other Key Changes": https://www.gibsondunn.com/eu-ai-act-omnibus-agreement-postponed-high-risk-deadlines-and-other-key-changes/