모두가 더 나은 답변을 위해 경쟁하고 있습니다. 하지만 돈이 되는 곳은 답변 측면이 아닙니다.
요약
AI 산업의 경쟁이 모델과 앱 계층을 넘어 사용자의 의도를 파악하는 '의도 계층(Intent Layer)'으로 이동하고 있음을 분석합니다. 모델은 유틸리티화되고 앱은 복제되기 쉬우므로, 사용자의 모호한 생각을 정밀한 명령으로 변환하는 번역 계층을 선점하는 것이 핵심 비즈니스 해자가 될 것이라고 주장합니다.
핵심 포인트
- 모델과 앱 계층은 차별화가 어려운 유틸리티 및 복제 대상임
- 진정한 비즈니스 해자는 사용자의 생각이 시작되는 '의도 계층'에 있음
- 인간이 프롬프트를 작성하는 대신 기계가 컨텍스트를 스스로 파악해야 함
- 의도 계층을 점유하는 자가 차세대 검색창과 같은 지배력을 가질 것
모델은 유틸리티(utility)가 되어가고 있으며, 앱은 일주일 만에 복제됩니다. 저는 해자(moat)가 한 단계 위, 즉 당신이 생각을 채 마치기도 전 단계에 있다고 생각합니다.
현재 업계 전체가 한 가지 일에 매진하고 있습니다. 바로 AI가 더 나은 답변을 하도록 만드는 것입니다. 더 큰 모델, 더 날카로운 프롬프트(prompt), 그리고 매주 쏟아져 나오는 또 다른 래퍼 앱(wrapper app)들 말이죠.
무언가를 더 많이 만들어낼수록, 저는 가치 있는 부분은 답변 측면에 전혀 있지 않다는 확신이 듭니다.
모두가 다투고 있는 두 가지 계층을 보십시오. 모델 계층(model layer)은 유틸리티(utility)로 변하고 있습니다. 토큰(token) 단위로 빌려 쓰는 것이며, 모두가 똑같은 것을 빌려 씁니다. 앱 계층(app layer)은 복제 경쟁 중입니다. 기능 하나가 뜨면, 누군가는 일주일 안에 복사본을 출시합니다. 장기적으로 두 계층 모두 방어 가능하지(defensible) 않습니다. 모두가 빌려 쓸 수 있는 것이나, 누구나 복제할 수 있는 것으로는 해자(moat)를 구축할 수 없습니다.
그렇다면 해자는 실제로 어디에 위치할까요?
거의 아무도 진지하게 연구하지 않는 곳, 즉 당신이 아직 채 마치지 못한 생각에 있습니다.
오늘날의 모든 AI 도구는 "당신이 이미 무엇을 원하는지 알아냈다"라는 단계의 하류(downstream)에 위치합니다. 당신은 머릿속에서 아이디어를 정리하고, 이를 프롬프트(prompt)로 변환하여 기계에 입력합니다. 우리는 심지어 그 변환 단계를 프롬프트 엔지니어링(prompt engineering)이라는 이름의 기술로 만들었습니다. 하지만 잠시 멈춰서 생각해보면, 이는 거꾸로 된 것입니다. 인간이 기계에 맞추고 있는 것이니까요. 이는 안정적인 구조가 아닙니다. 어떤 기술에서도 그랬던 것처럼 말입니다.
그 모든 것의 상류(upstream)에는 아이디어가 처음 떠오르는 순간, 즉 당신 스스로조차 그것을 명확히 설명할 수 없는 순간이 있습니다. _그 단계_에서 당신을 붙잡는 자가 그 이후에 일어나는 모든 것을 결정합니다. 어떤 모델이 호출될지, 어떤 앱이 열릴지, 당신이 어떤 경로를 택할지를 말이죠. 하류의 전체 체인은 그 첫 번째 접점에 의해 경로가 결정됩니다.
우리는 이미 이런 영화를 본 적이 있습니다. 검색창(search box)은 최고의 페이지를 보유해서가 아니라, 무언가를 찾고 싶어 하는 첫 번째 순간을 점유함으로써 인터넷을 지배했습니다. 그 순간을 소유하면 그 뒤에 따르는 모든 것을 유통할 수 있습니다.
의도 계층(intent layer)은 이번 세대의 검색창입니다. 이를 소유하는 자가 식탁 위의 가장 큰 몫을 차지할 것입니다.
그렇다면 구체적으로 그것은 무엇일까요?
번역 계층 (Translation layer): 당신의 머릿속에 있는 모호한 것을 기계가 정밀하게 실행할 수 있는 무언가로 바꾸는 과정입니다. 이것은 특정 모델이나 특정 앱에 속하지 않으며, 그 모든 것의 앞에 위치합니다. 오늘날 이 번역은 당신이라는 사람이 직접 수행하고 있으며, 우리는 이를 "프롬프트 작성 (writing prompts)"라고 부릅니다. 제가 하고 싶은 일은 이 작업을 인간으로부터 가져와 기계에게 넘겨주는 것입니다.
이를 실현하기 위한 세 가지 구체적인 베팅
첫째: 인간이 설명하게 만드는 것을 중단하십시오. 이를 뒤집어야 합니다. 기계가 당신의 컨텍스트 (context)를 읽고 당신이 무엇을 하고 있는지 스스로 파악하게 만드십시오. 당신이 원하는 대부분은 당신이 보고 있고 행동하고 있는 대상 안에 이미 작성되어 있습니다. 그것을 다시 말할 필요가 없어야 합니다.
둘째: 컨텍스트가 가장 풍부한 곳에서 이를 수행하십시오. 이것이 제가 첫 번째 행보로 입력 방식 (input method)이 아닌 브라우저를 선택한 이유입니다. 입력기 (IME)는 당신이 타이핑하고 있다는 사실만 압니다. 하지만 페이지는 당신이 _어떤 박스_에 타이핑하고 있는지, 어떤 콘텐츠를 대상으로 하는지, 어떤 목적을 위해 하는지를 압니다. 이는 차원이 다른 신호 (signal)입니다. 현 단계에서는 커버리지의 넓이보다 컨텍스트의 깊이가 압도적으로 중요합니다.
셋째: 중간 단계에서 의도 (intent)를 인식하는 것만을 목적으로 하는 컴포넌트 (component)가 필요합니다. 즉, 무질서한 컨텍스트 더미를 하위의 모든 프로세스가 실행할 수 있는 하나의 정밀하고 실행 가능한 의도로 압축하는 것입니다. 이것이 제가 여전히 스스로를 채찍질하며 매달리고 있는 핵심입니다. 이것이 해결되었다고 거짓말하지는 않겠습니다.
제가 굳게 지키는 한 가지 원칙
시스템은 오직 의도를 준비하는 데까지만 관여합니다. 그것을 실행할지 — 즉, 마지막 버튼을 누를지 — 는 언제나 당신의 몫입니다. 저는 당신의 발치까지 길을 닦아 놓을 것입니다. 하지만 당신을 대신해 발걸음을 내딛지는 않을 것입니다.
이 글은 스쳐 지나가는 사람들을 위해 쓰인 것이 아닙니다. 만약 당신이 이 계층이 어디에 위치할지, 그리고 결국 누가 이를 소유하게 될지에 대해 진지하게 고민하고 있다면 — 당신을 만나고 싶습니다. 인사해 주세요: lingchong@iterant-ai.com.
AI 자동 생성 콘텐츠
본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기