Mininglamp, Octo 오픈 소스 공개: 멀티 에이전트 팀을 위한 협업 레이어 설계

지난 1년 동안 AI 에이전트 분야에는 변화가 있었습니다. Claude Code는 전체 코드 엔지니어링 워크플로우를 독립적으로 처리할 수 있습니다. Codex는 백그라운드에서 개발 작업을 배치 실행(batch-execute)할 수 있습니다. 당사의 온디바이스(on-device) 모델인 Mano-P는 OSWorld 벤치마크에서 58.2%의 성공률을 기록하며, 특정 목적을 위해 구축된 GUI 에이전트 모델 중 1위를 차지했습니다. 개별 에이전트의 능력은 더 이상 병목 현상이 아닙니다.

하지만 기업들이 실제로 팀 전체에 에이전트 사용을 확장하려고 하면 다른 문제가 나타납니다. 바로 이 에이전트들이 서로 대화하지 않는다는 점입니다. 개발자의 에이전트는 코드를 작성합니다. 제품 관리자(Product Manager)의 에이전트는 요구사항을 정리합니다. 운영(Ops) 팀의 에이전트는 데이터를 분석합니다. 세 명의 에이전트가 서로 볼 수 없는 결과물을 만들어내고 있으며, 정보를 동기화하려면 여전히 수동으로 복사하여 붙여넣어야 합니다. 에이전트가 많아질수록 인간의 조정 부담은 커집니다.

문제는 에이전트가 충분히 똑똑하지 않다는 것이 아닙니다. 그들을 연결하는 인프라가 없다는 것이 문제입니다. 인터넷이 존재하기 전에도 모든 컴퓨터는 연산 능력(compute power)을 가지고 있었습니다. 세상을 바꾼 것은 그들을 하나로 연결한 네트워크 프로토콜(network protocol)과 통신 레이어(communication layer)였습니다.

Mininglamp Technology가 이제 오픈 소스로 공개한 Octo는 바로 이 격차를 목표로 합니다. 이는 인간-AI 에이전트 협업을 위해 구축된 오픈 소스 작업 플랫폼입니다. Octo의 핵심 가치는 또 다른 강력한 AI 어시스턴트를 만드는 것이 아니라, 기존 에이전트들을 동일한 협업 네트워크에 참여시켜 조직 수준의 조정 능력을 형성하는 데 있습니다.

GitHub: https://github.com/Mininglamp-OSS

Octo가 실제로 해결하는 문제

매일 AI 에이전트를 사용하는 팀을 위해, Octo는 세 가지 구체적인 고충(pain points)을 해결합니다.

배포 및 배포 비용(Deployment and distribution cost)이 높습니다. 전통적인 에이전트 워크플로우는 다음과 같습니다: 모든 구성원이 각자의 CLI를 설치하고, 환경을 설정하며, 토큰을 확보하고, 명령어를 학습해야 합니다. 10명 규모의 팀이라면 10개의 독립적인 배포가 필요함을 의미합니다. 신규 입사자에게는 추가적인 온보딩(onboarding)이 필요합니다. Octo는 에이전트를 IM(Instant Messaging) 협업 레이어에 연결합니다. 관리자가 채널에 디지털 아바타를 추가하기만 하면 배포가 완료됩니다. 팀원들은 추가 설치나 설정 없이 즉시 에이전트를 사용할 수 있습니다. 배포 효율성이 개인 수준에서 조직 수준으로 도약합니다.

에이전트의 작업 프로세스가 팀에게 보이지 않습니다. 에이전트가 누군가의 개인 터미널에서 실행될 때, 그것이 무엇을 했는지, 무엇을 생성했는지, 현재 상태가 어떤지는 오직 그 사람만이 알 수 있습니다. 다른 팀원들은 에이전트의 실행 과정을 검토하거나 중요한 지점에서 개입할 수 없습니다. Octo는 에이전트 실행을 공유된 팀 채널과 스레드(threads)로 이동시켜, 모든 참여자가 에이전트가 무엇을 하고 있는지 확인하고 실시간으로 피드백을 제공하거나 의사결정을 내릴 수 있도록 합니다.

멀티 에이전트 조정(Multi-agent coordination) 기능이 부족합니다. 어느 정도 복잡한 비즈니스 프로세스는 조사, 작성, 검토 및 실행을 포함할 수 있으며, 이는 서로 다른 에이전트들이 작업을 서로에게 전달(hand off)하는 것을 필요로 합니다. Octo의 3단계 구조(spaces, channels, threads)를 통해 여러 디지털 아바타를 동일한 워크플로우 내에서 할당, 스케줄링 및 체이닝(chaining)할 수 있으며, 이를 통해 완전한 작업 파이프라인을 형성할 수 있습니다.

왜 IM을 기반으로 하는가

Octo의 현재 버전은 IM을 기본 인터페이스로 사용합니다. 여기에는 명확한 엔지니어링적 근거가 있습니다.

IM은 기업 내 모든 구성원이 매일 높은 빈도로 사용하는 유일한 도구입니다. 에이전트 협업을 이 채널에 연결한다는 것은 사용자가 새로운 앱을 열거나 새로운 상호작용 패턴을 배울 필요가 없음을 의미합니다. 에이전트의 역량이 일상적인 워크플로우에 직접 나타납니다. 동료들이 채널에서 작업 중인 디지털 아바타를 볼 때, 그들은 해당 역량을 사용할 수 있다는 것과 사용 방법을 자연스럽게 이해하게 됩니다. 별도의 교육이나 출시 캠페인 없이도 대화 흐름을 따라 채택(Adoption)이 확산됩니다.

분명히 말씀드리자면, IM(Interaction Model)은 협업 네트워크로 들어가는 진입점이지 Octo의 전체는 아닙니다. Octo는 근본적으로 연결 레이어 (Connection Layer)입니다. 이는 사람, 디지털 아바타 (Digital Avatars), 실행 에이전트 (Execution Agents), 그리고 외부 도구들을 연결합니다. 제품이 진화함에 따라, Octo는 디지털 아바타를 Claude Code나 Codex와 같은 실행 에이전트와 더욱 통합하여, 에이전트 간 협업 (Agent-to-agent collaboration)을 가시화하고 추적 및 관리할 수 있게 만들 것입니다.

디지털 아바타 (Digital Avatars): 에이전트 정체성 설계

Octo는 에이전트를 공개 비서나 일반적인 AI 챗봇으로 포지셔닝하지 않습니다. 이들은 개별 사용자에게 속한 디지털 아바타입니다. 각 아바타는 사용자에 의해 생성되고, 해당 사용자에 의해 학습되며, 해당 사용자의 소유입니다. 아바타는 사용자의 지시 사항과 작업 스타일을 학습하고, 자신에게 할당된 작업 컨텍스트 (Work context)를 기억하며, 사용자가 승인하는 방식으로 작업을 수행합니다.

이러한 설계 선택은 두 가지 즉각적인 이점을 제공합니다. 첫째, 권한 관리 (Permission management)가 깔끔하게 유지됩니다. 디지털 아바타의 권한은 해당 봇의 설정과 해당 공간 내 소유자의 역할 권한 (Role permissions)의 교집합과 같습니다. 에이전트를 위한 별도의 권한 시스템이 필요하지 않습니다. 둘째, 책임 소재 (Accountability)를 완전히 추적할 수 있습니다. 디지털 아바타의 모든 작업은 생성자에게까지 추적되므로, 기업의 감사 (Audit) 및 컴플라이언스 (Compliance) 요구 사항을 충족합니다.

더 중요한 점은, 디지털 아바타는 항상 사용자의 확장일 뿐, 결코 대체물이 아니라는 것입니다. 사용자의 판단, 취향, 그리고 암묵지 (Tacit knowledge)는 사용자에게 속하며, 이는 추출되거나 증류되지 않습니다. 아바타는 실행과 조율을 담당하고, 사용자는 판단과 결정을 담당합니다. 인간과 기계 사이의 분업은 명확하게 유지됩니다.

핵심 기능

협업 구조 (Space / Channel / Thread)

Octo는 공간(spaces), 그룹(groups), 채널(channels), 스레드(threads)라는 4단계 토폴로지(topology)를 통해 협업을 구성합니다. 공간(Spaces)은 프로젝트나 부서의 경계에 적합한, 데이터가 완전히 격리된 협업 도메인입니다. 채널(Channels)은 특정 주제나 워크플로(workflow)를 중심으로 하는 협업 노드입니다. 스레드(Threads)는 채널 내에서의 작업 실행 단위입니다. 인간과 디지털 아바타는 이러한 구조 내에서 동일한 협업 기본 요소(primitives)를 사용하며, 에이전트(agent)를 위한 별도의 스케줄링 시스템이 필요하지 않습니다.

음성 입력 및 음성 편집 (Voice Input and Voice Editing)

에이전트의 처리 능력이 향상됨에 따라, 인간이 에이전트에게 정보를 입력하는 속도가 병목 현상(bottleneck)이 됩니다. Octo의 음성 입력은 문맥 인식 자동 수정(context-aware auto-correction) 기능을 결합하여, 사용자가 말하는 것만으로 빠르게 작업을 할당하고, 배경 정보를 추가하며, 피드백을 제공할 수 있게 합니다. 음성 편집은 기존 텍스트를 수정하기 위한 자연어 명령을 지원합니다. 예를 들어 "첫 번째 단락을 더 격식 있게 만들어줘" 또는 "마지막 문장을 삭제해줘"와 같은 명령을 통해 인간과 에이전트 간의 상호작용에서 발생하는 마찰을 줄여줍니다.

브라우저 확장 프로그램 (Browser Extension, Cmd+K)

Octo는 사용자의 기존 도구를 대체하지 않습니다. 대신 기존 도구와 병행하여 협업 기능을 제공합니다. 브라우저 확장 프로그램을 통해 어떤 웹페이지에서든 Cmd+K를 누르면 현재 페이지의 문맥(URL, 제목, 선택된 텍스트)이 디지털 아바타로 전송되거나 현재의 협업 스레드에 참조됩니다. Feishu 문서, Notion 노트, GitHub Issues, Jira 보드 등 모든 웹 기반 도구는 도구 자체의 수정 없이도 이러한 방식으로 에이전트 협업 네트워크에 연결될 수 있습니다.

group.md

각 채널이나 스레드는 group.md 문서와 연결될 수 있으며, AI 에이전트의 안내에 따라 공동으로 내용을 채워 넣을 수 있습니다. 프로젝트 킥오프(kickoff), 요구사항 정렬 세션, 또는 회고(retrospectives) 시에 에이전트는 단순히 질문에 수동적으로 답하는 것에 그치지 않습니다. 에이전트는 구조화된 토론을 능동적으로 조직하고, 참가자들이 구조화된 입력을 할 수 있도록 안내하며, 합의를 도출하고, 모두가 동의한 문서를 출력합니다.

오픈 소스 및 프라이빗 배포 (Open Source and Private Deployment)

Octo는 Mininglamp Technology에 의해 Apache 2.0 라이선스로 오픈 소스화되었으며, 프라이빗 배포 (Private Deployment)를 지원합니다. 모든 데이터는 사용자의 자체 인프라에 머물며, 제3자 서버를 절대 거치지 않습니다. 이는 데이터 보안이 타협 불가능한 기업용 시나리오에서 매우 중요합니다.

오픈 소스로 전환한 배경은 다음과 같습니다. AI 시대에는 소프트웨어 코드 자체를 복제하는 것이 점점 더 쉬워지고 있습니다. 조직의 진정한 해자 (Moat)는 고유한 업무 컨텍스트 (Work Context)와 판단력입니다. Octo는 플랫폼 역량을 완전히 개방하여, 사용자가 특정 플랫폼에 종속되는 대신 자신만의 업무 컨텍스트를 축적하고 고유한 디지털 아바타 (Digital Avatar)를 개발하는 데 집중할 수 있도록 합니다.

Mininglamp Technology 소개

Mininglamp Technology는 인지 지능 (Cognitive Intelligence)과 데이터 지능 (Data Intelligence)에 집중하는 기술 기업으로, AI 에이전트 (AI Agent) 분야에서 여러 오픈 소스 프로젝트를 진행하고 있습니다. 온디바이스 GUI 에이전트 모델인 Mano-P는 72B 버전으로 OSWorld 벤치마크에서 58.2%의 성공률을 기록하며, 모든 목적 특화형 GUI 에이전트 모델 중 1위를 차지했습니다. 4B 양자화 (Quantized) 버전은 Apple M4 + 32GB Mac에서 로컬로 실행되며, 효율적인 온디바이스 추론 (On-device Inference)을 위해 Cider 추론 가속 SDK와 결합됩니다. Octo는 조직 내 에이전트 협업 및 배포 문제를 해결합니다. 이 두 프로젝트는 함께 "단일 에이전트 역량"에서 "조직 수준의 에이전트 협업"으로 이어지는 완전한 기술적 경로를 형성합니다.

GitHub: https://github.com/Mininglamp-OSS

Insights

Mininglamp, Octo 오픈 소스 공개: 멀티 에이전트 팀을 위한 협업 레이어 설계

요약

핵심 포인트

Mininglamp, Octo 오픈 소스 공개: 멀티 에이전트 팀을 위한 협업 레이어 설계

Octo가 실제로 해결하는 문제

왜 IM을 기반으로 하는가

디지털 아바타 (Digital Avatars): 에이전트 정체성 설계

핵심 기능

협업 구조 (Space / Channel / Thread)

음성 입력 및 음성 편집 (Voice Input and Voice Editing)

브라우저 확장 프로그램 (Browser Extension, Cmd+K)

group.md

오픈 소스 및 프라이빗 배포 (Open Source and Private Deployment)

Mininglamp Technology 소개

댓글

ascend-tribe/openPangu-2.0-Flash (아직 Huggingface에 업로드되지 않았습니다)

Reachy Mini와 그의 친구 Eliza와 함께 포커 게임하기 - 24시간 만에 제작

Qwen3.6-35B-A3B에서의 규범 보존 Abliteration: 거부율 0%, 벤치마크 성능 유지, 오픈 소스 데이터셋

스톡 음악을 AI로 교체해 보았다 — 개발자/인디 해커로서의 경험담

ascend-tribe/openPangu-2.0-Flash (아직 Huggingface에 업로드되지 않았습니다)

Reachy Mini와 그의 친구 Eliza와 함께 포커 게임하기 - 24시간 만에 제작

Qwen3.6-35B-A3B에서의 규범 보존 Abliteration: 거부율 0%, 벤치마크 성능 유지, 오픈 소스 데이터셋

스톡 음악을 AI로 교체해 보았다 — 개발자/인디 해커로서의 경험담