토큰 타운 (Token Town)
요약
소프트웨어 팩토리 패러다임에서 에이전트 오케스트레이션과 비용 효율적인 모델 선택의 중요성을 다룹니다. 모든 작업에 최첨단 모델을 사용할 필요는 없으며, 모듈화된 설계를 통해 벤더 종속을 피하고 적절한 모델을 교체하며 사용하는 전략을 제안합니다.
핵심 포인트
- 소프트웨어 팩토리는 에이전트 간의 조율과 자율적 검토 능력이 핵심임
- 모든 작업에 고비용의 최첨단 모델을 사용할 필요는 없음
- 벤더 및 모델 종속을 피하기 위해 모듈화된 아키텍처 구축 권장
- 중간 수준의 작업에는 오픈 웨이트 모델 활용을 통한 비용 최적화 필요
화요일의 많은 세션들, 특히 메인 스테이지의 세션들은 소프트웨어 팩토리 (software factories)라는 아이디어를 중심으로 전개되었습니다. 인간이 감독관 위치에 있고, 다른 에이전트들의 작업을 확인하는 또 다른 에이전트들과 에이전트들을 조율하는 방식입니다. 현재 많은 조직의 시스템은 에이전트가 지시받은 대로만 작업을 수행하고 이후 인간에 의해 검증되는 단계에 머물러 있어, 아직 팩토리(factory)를 운영할 준비가 완벽히 되어 있지 않습니다. 소프트웨어 팩토리 패러다임의 핵심적인 부분은 스스로를 검토할 수 있는 능력을 통해 신뢰를 제공하는 것입니다. 이러한 더 큰 오케스트레이션 (orchestration) 및 평가 작업들은, 루프 안팎의 인간들과 필요한 신뢰를 구축하면서 자율적인 출력을 제공하기 위해 더 강력한 모델을 사용해야 할 수도 있습니다. 하지만 팩토리 내의 모든 에이전트가 동일한 요구 사항을 가질까요?
Notion의 Sarah Sachs는 바로 그 점에 대해 놀라운 강연을 해주었으며, 만약 놓치셨다면 녹화본을 꼭 시청하시기 바랍니다. 메인 스테이지는 라이브 스트리밍되었으므로 지금 바로 시청하실 수 있습니다. 그녀의 핵심 요점은 이것이었습니다: 우리 중 _대부분_은 프런티어 AI 랩 (frontier AI lab)에서 일하지 않습니다. 우리가 수행하는 일과 우리의 제품에서 이루어지는 일의 상당 부분은, 가장 크고, 가장 뜨겁고, 토큰을 가장 많이 잡아먹는 모델을 요구하지 않습니다. 만약 우리가 하나의 AI 벤더나 하나의 하드코딩된 AI 모델에 우리를 가두어 버린다면, 그것은 우리 자신과 주주, 그리고 고객들에게 해를 끼치는 일입니다.
현 시점에서는 어떤 벤더의 모델이라도 최첨단(bleeding edge)이 아닌 모델들조차 요약과 같은 단순하거나 중간 수준의 작업을 수행하기에는 꽤 괜찮고 충분히 훌륭합니다. Slack 스레드를 요약하는 데 Opus를 사용하는 것은 잘못된 선택입니다. 파일을 한 유형에서 다른 유형으로 변환하는 데에는 아마 어떤 모델도 필요하지 않을 것입니다. AI가 발전함에 따라 비용 또한 점점 더 비싸지고 있습니다. 다른 사회적, 환경적 비용과 마찬가지로 가격도 계속 상승하고 있으며,
Sarah의 조언은 벤더(vendor) 및 모델 종속(lock-in)을 피할 수 있도록 충분히 스마트하고 모듈화(modularly)된 방식으로 구축하라는 것이었습니다. 비용 청구 방식이 변할 때 고객을 위한 최선의 선택을 할 수 있도록 즉각적으로 모델과 벤더를 교체하십시오. 특히 "충분히 괜찮은" 수준이면 충분한 중간 단계의 작업(midrange tasks)들을 위해서는 오픈 웨이트 모델(open-weight models)을 시도해 보세요. 당신의 "공장"에 있는 모든 서로 다른 에이전트(agents)들의 요구 사항 사이에서 균형을 잡고, "토큰 경제학 (tokenomics)"이 당신에게 유리하게 작동하도록 만든다면, 다른 모든 이들을 위해서도 비용을 조금 더 균형 있게 유지하는 데 도움이 될 것입니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기