AI 에이전트가 당신의 동료가 되고 있습니다 — 실제로 일어나고 있는 일들 - Insights | Molayo

이번 주 AI 세계는 빠르게 움직였으며, 주의를 기울일 가치가 있습니다.

만약 당신이 한동안 AI를 팔로우해 왔다면, 다음과 같은 하이프 사이클(hype cycle)을 들어보았을 것입니다: "ChatGPT가 왔다", "LLM이 모든 사람을 대체할 것이다", "특이점(singularity)이 오고 있다". 소음은 실재하지만, 지금 실제로 다른 무언가가 일어나고 있습니다. 그리고 그것은 헤드라인이 암시하는 것만큼 극적이지는 않습니다.

변화: 채팅에서 에이전트로

지난 1년 동안 AI는 주로 대화에 관한 것이었습니다. 당신이 질문을 하면, LLM이 답합니다. 유용하지만, 또한... 수동적입니다. 여전히 당신이 통제권을 쥐고 있습니다. 무엇을 물어볼지 당신이 결정합니다. 답변을 가지고 무엇을 할지도 당신이 결정합니다.

그것이 변하고 있습니다.

이번 주, AWS는 자율적으로(autonomously) 작동하는 새로운 클래스의 AI 에이전트를 발표했습니다. 이들은 단순히 더 똑똑하게 들리는 챗봇이 아닙니다. 이들은 다음과 같은 일을 할 수 있는 시스템입니다:

당신이 요청하지 않아도 코드의 보안 취약점(security vulnerabilities)을 수정
이메일 수신함을 분류(triage)하고 메시어 우선순위 지정
여러 시스템에 걸쳐 작업 관리

Google의 AMIE 시스템은 최근 Nature 학술지에서 복잡한 질병 관리 측면에서 일차 의료 의사(primary care physicians)와 대등하다는 것을 입증했습니다. Adobe는 Firefly의 크리에이티브 에이전트(creative agents)를 Photoshop과 Premiere 전반으로 확장했습니다. 의료 AI는 이제 실제 진단 작업을 수행하고 있습니다.

이것이 변곡점입니다. 우리는 "당신이 통제하는 도구로서의 AI"에서 "당신을 대신하여 행동하는 동료로서의 AI"로 이동하고 있습니다.

이것이 중요한 이유 (그리고 그렇지 않은 이유)

솔직한 견해를 말씀드리자면: 자율성은 기회인 동시에 문제입니다.

기회: 보안 패치, 이메일 관리, 데이터 레이블링(data labeling)과 같이 지루하고 반복적인 일들을 지치거나 주의가 산만해지지 않는 무언가에 위임한다고 상상해 보십시오. 그것이 진정한 생산성 향상입니다.

문제: 불완전한 자율성은 위험합니다. Google은 방금 "점점 더 유능해지고 불완전하게 정렬된(imperfectly aligned) AI 에이전트에 맞서 내부 시스템을 보호하는 것"에 관한 연구를 발표했습니다. 번역하자면: 우리는 만약 잘못될 경우 피해를 입힐 수 있을 만큼 강력한 에이전트를 구축하고 있다는 뜻입니다.

따라서 우리는 현재 이 불편한 중간 지대에 놓여 있습니다. 에이전트는 실제 업무를 수행할 수 있을 만큼 똑똑하지만, 단독으로 완전히 신뢰받을 만큼 똑똑하지는 않습니다. 이를 잘 수행하고 있는 기업들은 정교한 균형을 맞추고 있습니다. 즉, 에이전트가 인간의 감독 (human oversight) 하에 구체적이고 잘 정의된 작업들을 처리하도록 하는 것입니다.

인프라 플레이 (The Infrastructure Play)

이 모든 것의 이면에서는 인프라가 급격하게 변화하고 있습니다.

유럽은 자체적인 프런티어 LLM (frontier LLM)을 보유하지 못했다는 사실을 깨닫고 있습니다. OVHcloud는 최근 (Meta의 Llama 이후) 유럽의 두 번째 주요 LLM을 훈련시키겠다는 계획을 발표했습니다. 한편, Alibaba는 자사의 플래그십 모델을 업데이트하고 새로운 AI 칩을 출시했습니다.

전달하려는 메시지는 명확합니다: LLM을 훈련하고 실행하는 데는 막대한 비용과 컴퓨팅 자원 (compute)이 소요된다는 것입니다. 인프라를 통제하는 국가와 기업이 담론 (narrative)을 통제합니다.

그리고 애플리케이션 계층 (application layer)에서는 LLM 오케스트레이션 (LLM orchestration)이 하나의 독립된 분야가 되고 있습니다. 현재 여러 모델을 함께 실행하는 방식을 관리하기 위해서만 존재하는 프레임워크 (frameworks)가 22개 이상 존재합니다.

요약: 만약 AI로 무엇인가를 구축하고 있다면, 인프라와 오케스트레이션은 모델 자체만큼이나 중요합니다.

당신이 실제로 해야 할 일

개발자라면, 다음과 같은 실용적인 관점을 가져야 합니다:

에이전트로 작게 시작하세요 — 완벽한 자율성 (autonomy)을 기다리지 마세요. 하나씩 구체적이고 범위가 제한된 작업(이메일 분류, 코드 리뷰, 데이터 처리 등)을 선택하여 이를 위한 에이전트를 구축하세요. 실제 업무로 테스트하십시오.
개선이 필요할 것임을 예상하세요 — 95%의 확률로 작동하는 자율성도 여전히 상당히 유용하지만, 모니터링이 필요합니다. 에이전트에 알림 (alerting) 및 인간의 체크포인트 (human checkpoints)를 구축하십시오.
인프라 트렌드를 주시하세요 — 대규모로 배포하는 경우, 어떤 모델을 사용하는지 (Claude vs GPT vs 오픈 소스)와 어떤 LLM 오케스트레이션 프레임워크를 사용하는지가 생각보다 훨씬 중요합니다.
보안은 사후 고려 사항이 아닙니다 — 에이전트의 정렬 불량 (agent misalignment)에 관한 Google의 연구는 실재하는 문제입니다. 만약 당신의 에이전트가 당신의 시스템 내에서 행동할 수 있다면, 언젠가는 이상한 결정을 내릴 것이라고 가정하십시오. 그에 맞춰 설계하십시오.

진짜 질문

지금의 헤드라인은 "AI 에이전트가 왔다"입니다. 그리고 그것은 사실입니다. 하지만 진짜 질문은 에이전트가 작동하느냐가 아닙니다. 바로 _우리가 아직 그것들을 어떻게 사용해야 하는지 알고 있는가_입니다.

우리에게는 능력이 있습니다. 하지만 아직 지혜는 없습니다.

그것이 변하고 있으며, 지켜볼 가치가 있습니다.

당신의 생각은 어떠신가요? AI 에이전트로 무언가를 구축하고 계신가요? 실제로 효과가 있는 것은 무엇이고, 여전히 과장(Hype)에 불과한 것은 무엇인가요? 댓글을 남겨주세요 — 제가 읽어봅니다.

AI 에이전트가 당신의 동료가 되고 있습니다 — 실제로 일어나고 있는 일들

요약

핵심 포인트

변화: 채팅에서 에이전트로

이것이 중요한 이유 (그리고 그렇지 않은 이유)

인프라 플레이 (The Infrastructure Play)

당신이 실제로 해야 할 일

진짜 질문

댓글