모델 중립성: AI 벤더 종속(Vendor Lock-In)을 피해야 하는 이유

우리는 소프트웨어의 또 다른 세대적 전환기에 있습니다

약 20년마다 소프트웨어가 구축되는 방식이 변화하며, 모든 엔지니어링 조직이 작업 방식을 재구조화하도록 강요합니다. 온프레미스(On-prem)에서 클라우드(Cloud)로의 전환이 마지막 사례였습니다. 에이전트(Agents)가 다음 전환이며, 지난 전환과 달리 이번 전환은 수년이 아닌 수개월 만에 일어나고 있습니다.

모든 전환은 누구에게 의존하는지, 비즈니스 로직의 얼마나 많은 부분이 단일 벤더(Vendor)에 종속되는지, 그리고 떠나는 데 비용이 얼마나 드는지에 대해 동일한 질문들을 던집니다. 지난번에는 기업들이 이러한 질문들에 대해 대부분 뒤늦게 답했습니다. 그 대가로 종속(Lock-in), 예측 불가능한 가격 책정, 그리고 실패한 마이그레이션(Migration) 비용을 향후 10년 동안 치러야 했습니다.

우리는 모델(Models)을 가지고 정확히 똑같은 일을 하려 하고 있습니다. 우리는 방금 지난 전환기를 겪었습니다. 교훈은 바로 그곳에 있습니다.

클라우드 시대가 주는 교훈

저는 클라우드 시대의 한복판에 있었던 HashiCorp에서 수년을 보냈습니다. 그곳에서 배운 가장 중요한 사실은 클라우드 종속(Cloud lock-in)에 관한 표면적인 이야기(장애, 가격 결정권, 장애 조치(Failover))는 논쟁의 쉬운 부분에 불과했다는 것입니다. 더 깊은 이야기는 하이퍼스케일러(Hyperscalers)들이 실제로 무엇을 팔고 있었는가에 관한 것이었습니다.

그들은 범용 제품(Commodities)을 팔고 있었습니다. 스토리지(Storage), 네트워크(Network), 컴퓨팅(Compute) 말입니다. AWS 스토리지와 GCP 스토리지는 디스크 상의 바이트(Bytes-on-disk) 수준에서 구별할 수 없는 제품입니다. 그리고 기반 제품이 범용 제품이기 때문에, 고객이 계속 당신의 제품을 소비하게 만드는 유일하고 지속 가능한 방법은 툴링 계층(Tooling layer)에서 그들을 종속시키는 것이었습니다. AWS를 위한 CloudFormation, Azure를 위한 ARM 템플릿, GCP를 위한 Vertex가 그것입니다. 이 도구들 중 그 어떤 것도 경쟁사의 최고 수준 기능을 동등하게 지원할 내재적인 동기가 없었습니다. 그렇게 하는 것은 떠나기 더 쉽게 만들 뿐이기 때문입니다.

Terraform이 존재하는 이유 전체는 이러한 툴링 계층의 종속이 실재하며, 비용이 많이 들고, 점점 악화되고 있다는 점, 그리고 올바른 해답은 그보다 한 단계 위에서 중립적인 추상화(Abstraction)를 제공하는 것이라는 점이었습니다. 즉, 인프라를 다시 작성하지 않고도 전환할 권리와 단일 배포 내에서 여러 제공업체를 혼합할 수 있는 능력입니다.

그 논리가 승리했습니다. 한꺼번에 이루어진 것은 아니지만, 결국 승리했습니다. 중립성을 조기에 채택한 기업들은 떠나는 것이 실질적인 대안이 될 수 있었기에 하이퍼스케일러 (Hyperscaler)의 가격 책정에 저항할 수 있었고, 장애 발생 시 페일오버 (Failover)가 이론에 그치지 않았기에 중단 사태를 견뎌낼 수 있었습니다. 단일 벤더 스택 (Single-vendor stack)에서는 이 중 어느 것도 가능하지 않습니다.

파운데이션 랩 (Foundation labs)들도 동일한 전략을 실행 중입니다

이제 모델에서 일어나고 있는 일을 보십시오.

랩 (Labs)들은 여러분에게 토큰 (Tokens)을 판매하고 있습니다. 토큰은 범용 제품 (Commodity)이며, 점점 더 그렇게 되어가고 있습니다. 프런티어 모델 (Frontier models) 간의 격차는 좁혀지고 있고, 오픈 웨이트 (Open-weight) 모델들은 빠르게 추격하고 있으며, 백만 토큰당 가격 차트는 2년 동안 꾸준한 하향 곡선을 그려왔습니다. 랩들은 이 사실을 알고 있습니다. 그들도 여러분과 똑같은 차트를 보고 있습니다.

따라서 그들의 다음 행보는 여러분을 하네스 (Harness, 제어 프레임워크) 단계에서 포착하는 것이며, 여러분은 그들 모두가 동시에 이 작업을 수행하는 것을 목격하게 될 것입니다. Claude Agent SDK, OpenAI의 Agents API, Vertex AI Agent Builder. 모두 같은 형태입니다. 만약 그들이 여러분의 비즈니스 로직이 살아있는 오케스트레이션 레이어 (Orchestration layer)를 점유하게 된다면, 여러분은 어딘가에 더 좋고, 더 저렴하거나, 더 적합한 모델이 존재하더라도 계속해서 그들의 토큰을 소비하게 될 것입니다.

그들은 자신들의 하네스를 경쟁사의 모델과 함께 실행하기에 훌륭한 경험을 제공하도록 만들 상업적 동기가 없습니다. CloudFormation이 GCP 리소스를 대등하게 프로비저닝할 이유가 전혀 없었던 것과 같습니다. Claude Agent SDK가 GPT, Gemini 또는 Llama를 호출하는 것을 퍼스트 클래스 (First-class) 급으로 느끼게 만들 이유도 없습니다. 랩의 관점에서 볼 때, 자신들의 하네스 내부에서 경쟁사 모델이 잘 작동하게 만드는 것은 수익을 깎아먹는 일입니다. 그들은 그렇게 하지 않을 것입니다.

하네스 종속 (Harness lock-in)은 모델 종속 (Model lock-in) 자체보다 해제하기가 더 어려울 것입니다. 왜냐하면 하네스는 여러분의 비즈니스 로직이 존재하는 곳이기 때문입니다.

모델 중립성이 클라우드 중립성보다 더 중요한 이유

교훈이 같다면 대응책도 같습니다. 바로 중립적인 하네스입니다. Terraform이 클라우드에서 수행했던 것과 같은 종류의 레이어 말입니다.

모델 중립성은 클라우드 중립성이 가졌던 것보다 훨씬 더 중요합니다. 세 가지 이유가 있습니다:

변화의 속도가 근본적으로 다릅니다. AWS에서 GCP로 매달 애플리케이션을 옮기지는 않습니다. 계약을 갱신할 때나 서비스 중단(outage)이 발생했을 때 옮기게 되며, 이는 몇 년에 한 번 있을 법한 일입니다. 하지만 연구소(labs)들은 매 분기, 심지어 매달 서로를 앞질러 도약하고 있습니다. 한 공급업체에 종속된 팀은 단순히 서비스 중단이나 가격 변동에 노출되는 것에 그치지 않습니다. 새로운 기술적 도약이 일어날 때마다 매번 그 기회로부터 차단됩니다.

모델들은 선택적으로 범용화(commoditizing)되고 있습니다. 연구소들이 하네스(harness) 레이어에 집중하는 이유는 기본적인 추론(reasoning), 일반적인 질의응답(Q&A), 요약과 같은 쉬운 차원에서는 원시 모델(raw model) 간의 차별화가 희석되고 있기 때문입니다. 하지만 모든 영역에서 범용화가 일어나는 것은 아닙니다. OpenAI가 격차를 좁히고 있긴 하지만, 현재 코딩에는 Anthropic 모델을 찾는 것이 정석이며, 멀티모달(multimodal) 분야에서는 OpenAI가 앞서 있습니다. 순위는 몇 달마다 바뀝니다. 실제 프로덕션 에이전트(production agent)에서의 정답은 종종 동일한 워크플로 내에서 하나 이상의 모델을 사용하며, 각 작업을 현재 가장 잘 수행하는 모델로 라우팅(routing)하는 것입니다. 이는 어느 한 편을 들지 않는 하네스가 있어야만 가능합니다.

오픈 웨이트(Open-weight) 모델들이 실질적인 대안이 되고 있습니다. Llama, Mistral, DeepSeek, Qwen 등이 그 예입니다. 자체 호스팅(Self-hosting)은 대부분의 기업에게

중립적인 하네스(Harness)는 세 가지 요건을 갖추어야 합니다.

오픈 소스 (Open source). 코드의 모든 줄을 읽을 수 있어야 합니다. 아무것도 숨겨져 있거나, 몰래 수집되거나, 귀하의 손해를 보면서 특정 벤더(Vendor)에게 최적화되도록 배치되어서는 안 됩니다. 모델 연구소(Model lab)에서 출시하는 폐쇄형 소스 (Closed-source) 에이전트 프레임워크는 마케팅에서 무엇을 주장하든 중립적이지 않습니다.

즉시 사용 가능한 멀티 모델 (Multi-model out of the box). 동일한 하네스로 어떤 백엔드(Backend)든 사용할 수 있어야 합니다. GPT, Claude, Gemini, Llama, Mistral, DeepSeek, Qwen, 그리고 방화벽 뒤에 자체 호스팅(Self-host)하는 그 어떤 것이든 가능해야 합니다. 어떤 제공업체도 추상화 계층을 소유하지 않기에, 하나의 에이전트 정의로 모든 제공업체를 일급 시민(First-class)으로 지원합니다.

최저 공통 분모가 아닌, 프로필 인식 (Profile-aware, not lowest-common-denominator). 중립성이란 모든 모델이 서로 교체 가능하다는 것처럼 가장해야 할 의무를 의미하지 않습니다. 모든 프런티어 모델 (Frontier model)은 고유한 개성을 가지고 있으며, 일반화되지 않는 강점, 프롬프트 패턴 (Prompt patterns), 그리고 도구 호출 (Tool-calling) 스타일을 가지고 있습니다. 훌륭한 중립적 하네스는 모델 프로필 (Model profiles)을 노출하여, 특정 모델에 종속되지 않으면서도 각 모델의 탁월한 점을 활용할 수 있게 합니다. 이는 평준화(Flatten)를 요구하는 것이 아니라, 전환할 수 있는 권리를 제공하는 것입니다.

이것이 바로 우리가 Deep Agents를 통해 구축한 것이며, LangChain이 핵심적으로 지향해 온 가치입니다. 이는 오픈 소스이며, 멀티 모델을 지원하고, 프로필을 인식합니다. 단일 모델 제공업체보다 더 오래 살아남도록 설계된 하네스입니다.

우리는 이 일을 해낸 적이 있습니다

하이퍼스케일러 (Hyperscalers)들은 범용 제품 (Commodities)을 판매하며 툴링 계층 (Tooling layer)에서 귀하를 종속시켰습니다. 이제 연구소들은 범용 제품을 판매하며 하네스 계층에서 귀하를 종속시키려 하고 있습니다. Terraform은 한 단계 위에서 중립적인 계층이 됨으로써 클라우드 시대에서 승리했습니다. 중립적이고 개방적인 하네스는 모델 시대에 대한 그에 상응하는 해답입니다.

차이점이 있다면, 이러한 변화는 지난번보다 한 차수(Order of magnitude) 더 빠르게 움직이고 있으며, 잘못 판단했을 때의 비용 또한 한 차수 더 빠르게 복리로 증가한다는 점입니다.