AI 에이전트가 인간을 대체하지는 못할 것입니다 — 하지만 잘못된 에이전트는 운영 환경을 망가뜨릴 수 있습니다 - Insights | Molayo

몇 달마다 누군가는 이렇게 말합니다:

“AI 에이전트가 개발자를 대체할 것이다.”

저는 그것이 올바른 관점이라고 생각하지 않습니다.

AI 에이전트는 코드를 작성하고, 로그를 요약하며, Pull Request (PR)를 생성하고, 티켓을 만들고, API를 호출하고, 테스트를 실행하며, 우리가 허용한다면 소프트웨어를 배포할 수도 있습니다. 그것은 인상적입니다.

하지만 인간을 대체한다는 것은 단순히 작업을 수행하는 것만을 의미하지 않습니다.

실제 운영 시스템 (Production systems)에서 어려운 점은 단지 코드를 작성하는 것만이 아닙니다. 어려운 점은 컨텍스트 (Context)를 이해하고, 결과에 책임을 지며, 트레이드오프 (Trade-offs)를 결정하고, 사용자를 보호하며, 무언가 잘못되었을 때 책임을 지는 것입니다.

AI 에이전트는 동작을 실행할 수 있습니다.

인간은 그 결과에 책임을 집니다.

그 차이가 중요합니다.

AI 에이전트란 무엇인가?

단순한 챗봇은 프롬프트 (Prompt)에 답합니다.

AI 에이전트는 그보다 더 나아갑니다. 목표에 대해 추론하고, 도구를 선택하며, API를 호출하고, 파일을 읽고, 시스템을 수정하며, 여러 단계를 거쳐 작업을 계속할 수 있습니다.

예시:

목표: 실패하는 결제 파이프라인 (Payment pipeline) 수정

에이전트 동작:
...

그것은 유용해 보입니다. 실제로도 그렇습니다.

하지만 이제 동일한 에이전트가 운영 환경 자격 증명 (Production credentials), 배포 권한, 고객 데이터, 또는 데이터베이스 관리자 (Database admin) API에 접근할 수 있다고 상상해 보십시오.

갑자기 이것은 단순한 자동화가 아닙니다.

이것은 운영 리스크 (Operational risk)입니다.

위험한 질문은 “에이전트가 그것을 할 수 있는가?”가 아닙니다.

위험한 질문은 다음과 같습니다:

에이전트가 확신을 가지고 틀렸을 때는 어떤 일이 벌어지는가?

인간도 실수를 합니다. 하지만 운영 엔지니어링 (Production engineering)에는 인간의 실수를 방지하기 위한 수십 년간의 안전 패턴이 있습니다: 코드 리뷰 (Code review), 스테이징 (Staging), 롤백 (Rollback), 액세스 제어 (Access control), 감사 로그 (Audit logs), 사고 대응 (Incident response), 직무 분리 (Separation of duties), 그리고 사후 분석 (Postmortems).

AI 에이전트도 동일한 규율이 필요합니다.

사실, 그들은 더 많은 것이 필요합니다.

왜냐하면 에이전트는 기이한 방식으로 실패할 수 있기 때문입니다:

잘못된 가정
   ↓
잘못된 계획
...

리스크는 AI 에이전트가 “악해서” 발생하는 것이 아닙니다.

리스크는 에이전트가 신뢰할 만큼 충분히 유용하지만, 위험할 정도로 신뢰할 수 없다는 점에 있습니다.

치명적인 운영 오류 예시

다음 시나리오를 상상해 보십시오:

사용자: 데이터베이스에서 오래된 테스트 데이터를 삭제해줘.

에이전트:
...

에이전트는 운영 환경 (production)을 파괴할 "의도"가 없었습니다.

하지만 운영 환경은 의도에 상관하지 않습니다.

운영 환경은 영향 (impact)에 상관합니다.

인간의 잘못된 명령과 AI 에이전트의 잘못된 명령은 모두 동일한 데이터베이스를 삭제할 수 있습니다.

그렇기 때문에, 단지 채팅창에서 똑똑한 답변을 내놓는다는 이유만으로 AI 에이전트에게 무제한의 권한을 부여해서는 안 됩니다.

더 안전한 에이전트를 위한 간단한 아키텍처 스키마 (architecture schema)

운영 환경급 (production-grade) AI 에이전트는 핵심 시스템에 직접 연결되어서는 안 됩니다.

권한 계층 (permission layers), 승인 게이트 (approval gates), 모니터링 (monitoring), 그리고 롤백 메커니즘 (rollback mechanisms)을 거쳐야 합니다.

flowchart TD
    User[Human User] --> Agent[AI Agent]
    Agent --> Planner[Planner / Reasoning Layer]
...

핵심 아이디어:

에이전트는 제안할 수 있습니다. 시스템이 제어합니다. 인간이 중요한 동작을 승인합니다.

에이전트 안전 정책 스키마 (agent safety policy schema)

에이전트를 배포하기 전에, 인프라 (infrastructure), 보안 (security), 또는 API 계약 (API contracts)을 정의하듯이 에이전트의 권한을 정의하십시오.

다음은 간단한 YAML 스타일의 스키마입니다:

agent:
  name: production-assistant
  purpose: "Help engineers investigate issues and propose fixes"
...

이것은 과잉 엔지니어링 (over-engineering)이 아닙니다.

이것은 기본적인 생존 전략입니다.

만약 에이전트가 운영 환경에 접근할 수 있다면, 반드시 운영 환경의 행위자 (production actor)처럼 취급해야 합니다.

AI 에이전트를 위한 리스크 공식 (risk formula)

에이전트의 리스크를 생각하는 간단한 방법은 다음과 같습니다:

Risk = Autonomy × Permission × Irreversibility × Blast Radius

로그를 요약하는 에이전트는 리스크가 낮습니다.

코드를 배포할 수 있는 에이전트는 중간 정도의 리스크를 가집니다.

운영 데이터베이스를 수정할 수 있는 에이전트는 높은 리스크를 가집니다.

승인 없이 운영 데이터베이스를 수정할 수 있는 에이전트는 곧 닥쳐올 재앙입니다.

유명 기술인들이 실제로 우리에게 경고하는 것

Linus Torvalds는 AI의 과장된 홍보 (hype)에 대해 회의적인 태도를 보여왔습니다. 그의 관점은 엔지니어들에게 매우 중요합니다: 데모 (demo)와 실제 환경의 신뢰성 (reliability)을 혼동하지 마십시오.

데모는 마법처럼 보일 수 있습니다.

운영 환경은 진실이 드러나는 곳입니다.

Jensen Huang은 AI가 단순히 엔지니어를 제거하는 것이 아니라, 생산적인 팀이 구축할 수 있는 결과물을 늘릴 것이라고 주장해 왔습니다. 저는 "AI가 모든 사람을 대체할 것이다"라는 서사보다 그 의견에 더 동의합니다.

미래는 인간이 줄어드는 세상이 아닙니다.

미래는 더 강력한 도구와 더 큰 책임을 가진 인간의 세상입니다.

Yann LeCun의 연구 또한 현재의 AI 시스템이 여전히 인간의 지능과 대등하지 않다는 점을 상기시켜 줍니다. AI는 인간이나 동물처럼 세상으로부터 학습하지 않습니다. 비즈니스 맥락 (business context), 사회적 결과, 또는 도덕적 책임 (moral responsibility)을 진정으로 이해하지 못합니다.

Sam Altman은 AI 에이전트가 "노동 인력에 합류할 (join the workforce)" 수도 있다고 말했습니다. 그 표현은 흥미롭습니다.

합류 (Join).

대체 (Replace)가 아닙니다.

그것이 바로 엔지니어링 팀이 채택해야 할 사고방식입니다.

왜 여전히 인간이 중요한가

인간은 단순히 코드를 타이핑하기 때문에 가치 있는 것이 아닙니다.

인간은 다음과 같은 질문을 던질 수 있기 때문에 가치 있습니다:

우리가 이것을 해야 하는가?
누가 영향을 받는가?
이것이 실패하면 어떤 일이 발생하는가?
...

AI 에이전트는 가능한 행동 (actions)을 생성하는 데 능숙합니다.

인간은 수용 가능한 행동을 선택할 책임을 집니다.

그것이 바로 경계선입니다.

AI 에이전트 사용 전 운영 환경 체크리스트

AI 에이전트를 엔지니어링 워크플로 (engineering workflow)에 도입하기 전에 다음을 질문하십시오:

[ ] 에이전트가 최소 권한 원칙 (least-privilege access)을 따르고 있는가?
[ ] 운영 환경의 비밀 정보 (production secrets)에 접근할 수 있는가?
[ ] 파괴적인 작업 (destructive actions)을 수행할 수 있는가?
...

이 질문들에 대한 답이 "아니오"라면, 그 에이전트는 운영 환경 (production)에 투입될 준비가 되지 않은 것입니다.

샌드박스 (sandbox)에는 준비가 되었을지 모릅니다.

진정한 미래: 인간 + 에이전트

AI 에이전트는 소프트웨어 엔지니어링을 변화시킬 것입니다.

그들은 일부 작업을 더 빠르게 만들 것입니다. 반복적인 업무를 줄여줄 것입니다. 소규모 팀이 대규모 팀처럼 움직일 수 있도록 도울 것입니다. 개발자가 익숙하지 않은 코드베이스 (codebases)를 더 빠르게 이해하도록 도울 것입니다.

하지만 인간의 판단 (human judgment)을 대체해서는 안 됩니다.

최고의 엔지니어링 팀은 모든 것을 맹목적으로 자동화하는 팀이 아닐 것입니다.

최고의 팀은 무엇을 자동화할지, 무엇을 감독할지, 그리고 무엇이 항상 인간의 결정으로 남아야 하는지를 아는 팀이 될 것입니다.

AI 에이전트는 강력합니다.

하지만 통제 없는 힘은 지능이 아닙니다.

그것은 리스크 (risk)입니다.

그러므로, 아니요, AI 에이전트가 인간을 대체하지는 못할 것입니다.

하지만 에이전트를 안전하게 사용하는 방법을 이해하는 팀이 그렇지 못한 팀을 대체할 수는 있습니다.

그것이 진정한 변화입니다.

AI 에이전트가 인간을 대체하지는 못할 것입니다 — 하지만 잘못된 에이전트는 운영 환경을 망가뜨릴 수 있습니다

요약

핵심 포인트