rsync 참사가 증명하는 AI가 인프라 코드를 다룰 준비가 되지 않은 이유

역사상 가장 중요한 Unix 도구 중 하나를 관리하는 유지보수자가 실제로 릴리스를 배포하기 위해 Claude를 사용했습니다. 그리고 그것은 절대 경로(absolute path) 처리를 망가뜨렸습니다. 이 사실을 잠시 곱씹어 보십시오.

Rsync는 수백만 대의 서버에서 백업 스크립트, 배포 파이프라인(deployment pipeline), 미러 인프라(mirror infrastructure)가 조용히 작동하도록 유지해 주는 도구입니다. AI 보조 커밋(AI assisted commits)이 포함된 릴리스에 회귀(regression)가 발생했습니다. 비록 이 버그가 AI에 의해 자동 완성된 잘못된 로직에 의해 도입된 것은 아니었지만, 보안 강화 패치(security hardening patch)에 의해 발생했습니다.

rsync가 단순한 도구가 아닌 이유

rsync는 시대를 초월한 도구입니다. 너무나 신뢰성 있게 작동하여 존재 자체를 잊게 만드는 종류의 소프트웨어입니다. 그리고 rsync의 델타 전송 알고리즘(delta-transfer algorithm)은 두 파일 세트 간의 차이점만 전송합니다. 5년 이상 된 모든 배포 파이프라인은 아마도 이 도구를 사용하고 있을 것입니다.

rsync가 제 역할을 하지 못하면, 당신이 인지하지 못하는 사이에 백업이 중단됩니다. 배포가 동기화되지 않습니다. 미러링된 데이터가 업데이트되지 않습니다. 이 도구가 어디에나 존재하기 때문에 그 영향 범위(blast radius)는 엄청납니다.

AI는 "아무것도 망가뜨리지 마라"를 이해하지 못한다

여기에 핵심적인 문제가 있습니다. AI 코딩 어시스턴트(AI coding assistants)는 패턴을 기반으로 학습됩니다. 이들은 새로운 코드를 생성하고, 기능의 뼈대(scaffolding)를 만들고, 함수를 자동 완성하는 데 탁월합니다.

하지만 안정적인 인프라 코드(infrastructure code)는 그대로 유지되는 것을 목적으로 합니다. 동작이 변해서는 안 됩니다. Rsync의 경로 처리는 누군가가 15년 전 운영 환경(production)에서 해당 시나리오를 겪었기 때문에 모든 시나리오에 대한 예외 케이스(edge case)를 가지고 있습니다. 코드의 로직은 의도적으로 이상해 보이도록 만들어져 있습니다.

AI 어시스턴트는 그것을 알지 못합니다. AI는 "개선될 수 있을 것 같은" 코드를 보고 기쁘게 변경 사항을 제안합니다. AI는 다음과 같은 개념이 없습니다:

→ 사용자들과의 수십 년에 걸친 암묵적 계약 (implicit contracts)
→ 겉보기에 이상한 로직으로 인코딩된 예외 케이스 (edge cases)
→ "정확함"과 "이 특정 코드베이스에 정확함" 사이의 차이
→ 인프라에서 미묘한 회귀(regression)가 발생했을 때의 파멸적인 비용

Claude가 rsync를 망가뜨렸을지는 모르지만, 그것이 의도적이었다고 말하는 것은 불공평합니다. 단지 Claude는 이미 작동하고 있는 것은 아무것도 바꾸지 않는 것이 최우선 순위라는 점을 이해하지 못했을 뿐입니다.

신뢰의 문제는 실재한다

저는 매일 AI 어시스턴트(AI assistants)에 의존합니다. 이들은 제가 코드를 더 빠르게 작성하고, 개념을 실험하며, 보일러플레이트 (boilerplate) 코드를 구성하는 것을 도와줍니다. 저는 AI에 반대하는 것이 아닙니다. 🙄

그럼에도 불구하고, 저는 인프라 코드에서 AI가 중요한 결정을 내리도록 절대 허용하지 않을 것입니다. 다만 저는 AI의 모든 제안을 이 코드를 처음 보는 주니어 개발자(junior developer)가 제안하는 것처럼 취급할 것입니다.

위험한 부분은 AI 자체가 아닙니다. 그것은 바로 신뢰의 기울기 (trust gradient) 입니다. AI가 연속으로 열 번의 좋은 제안을 하면, 열한 번째 제안도 안전하게 느껴집니다. 당신은 그것을 조금 덜 주의 깊게 검토하게 됩니다. 당신은 그것을 조금 더 빠르게 승인하게 됩니다.

UI 버그는 새로운 웹 앱의 사용자 인터페이스 (user interface)에 문제가 있음을 나타내지만, 수백만 대의 머신 전체에서 절대 경로 (absolute paths)가 깨지는 것은 rsync에 문제가 있음을 나타냅니다.

여기서 얻을 수 있는 실제 교훈

이 이야기는 AI가 악당이라는 것에 관한 것이 아닙니다. 이것은 컨텍스트 붕괴 (context collapse) 라고 불리는 현상에 관한 것입니다.

AI 어시스턴트는 코드베이스 (codebase)의 중요성에 대해 전혀 알지 못합니다. 이들은 주말 프로젝트나 30년 된 유닉스 유틸리티 (Unix utility)나 똑같이 충분할 것이라고 확신합니다. 생각만 해도 무서운 일입니다. 😬

물론 책임은 여전히 유지 관리자 (maintainer)에게 있습니다. 하지만 이는 업계가 빠르게 내재화해야 할 무언가를 강조합니다:

→ AI 지원 개발은 위험 수준에 따라 서로 다른 가드레일 (guardrails) 이 필요합니다
→ 인프라 코드는 AI가 틀렸다고 가정하는 리뷰 프로세스를 요구합니다
→ 인터넷을 지탱하는 도구들에게 "컴파일이 되었고 테스트를 통과했다"는 것만으로는 충분하지 않습니다
→ 코드베이스가 오래되고 안정적일수록, AI의 제안은 더욱 위험해집니다

우리는 모두 자신의 파이프라인 (pipeline)에 AI를 운영화 (operationalize)하기 위해 경주하고 있는 역사적 시점에 있습니다. 대부분의 코드에는 이것이 괜찮지만, 어떤 코드들은 단 한 번의 회귀 (regression) 비용이 전 세계적으로 프로덕션 시스템 (production systems)이 붕괴되는 것으로 정의되는 계층에 속해 있습니다.

Rsync 또한 그 그룹에 속합니다. OpenSSL, coreutils, 그리고 여러분의 데이터베이스 드라이버 (database driver) 역시 마찬가지입니다.

우리는 어디에서 선을 그어야 하는가?

저는 그 답이 "인프라에 AI를 절대 사용하지 마라"라고 생각하지는 않습니다. 그것은 현실적이지 않습니다. 하지만 우리는 언제 기계를 불신해야 하는지에 대해 훨씬 더 나은 직관을 길러야 합니다.

rsync 사건은 사실 선물처럼 느껴지기도 합니다. 아무도 데이터를 영구적으로 잃지 않았고, 회귀 (regression) 오류가 발견되어 수정되었기 때문입니다. 하지만 이는 릴리스 (releases)를 위해 AI에 의존하기 시작한 모든 유지 관리자 (maintainer)들에게 보내는 경고 사격입니다. ⚠️

여러분의 임계값은 어디입니까? 코드베이스의 중요도가 어느 지점에 도달했을 때, 한 줄 한 줄 의심스러운 수준의 검토 없이 AI가 생성한 제안을 받아들이는 것을 중단하시겠습니까?