본문으로 건너뛰기

© 2026 Molayo

Dev.to헤드라인2026. 05. 27. 04:09

Mac mini에서 구동되는 8개의 로컬 AI 에이전트 — 그리고 이를 통해 내가 만들고 있는 제품

요약

Apple Silicon 환경에서 클라우드 API 없이 로컬로 구동되는 AI 에이전트 구축 경험과 시장 기회를 분석합니다. 오픈 소스 프로젝트인 claude-code-local을 통해 로컬 LLM을 활용한 에이전트 시스템의 제품화 가능성을 다룹니다.

핵심 포인트

  • Gemma 4, Llama 3.3 등 로컬 모델을 활용한 MLX 서버 구축
  • 클라우드 API 없이 Mac mini 등 로컬 하드웨어에서 에이전트 구동 가능
  • 오픈 소스 프로젝트의 스타/포크를 수익 모델로 전환하는 전략의 중요성
  • 온디바이스 AI 시장의 세그먼트별 수익 구조 분석

최근 한 사례 연구가 화제가 되었습니다. 한 변호사가 자신의 법률 사무소를 위해 Mac mini에 66개의 AI 에이전트를 연결했습니다. 모든 에이전트는 로컬(locally)에서 실행되었으며, 클라우드 API(cloud API)에는 전혀 접속하지 않았습니다. 그는 이 시스템을 오픈 소스(open source)로 공개하기 전에 상업적 파트너를 찾고 있었습니다.

그 글을 읽으며 저 또한 지난 1년 동안 제 작은 사업을 위해 동일한 형태의 것을 구축해 왔다는 사실을 깨달았습니다. Apple Silicon에서 실행되는 8개의 앰비언트 에이전트(ambient agents)가 있었고, 그중 어느 것도 클라우드 API(cloud APIs)를 사용하지 않았습니다. 하지만 저는 그중 어떤 것도 제품화(productized)하지 못했습니다. 또한 그 어떤 것에 대해서도 대가를 받지 못했습니다.

이 포스트는 제가 그 문제에 대해 무엇을 하고 있는지에 관한 것입니다.

자산 기반 (The asset base)

저는 claude-code-local이라는 리포지토리(repo)를 출시했습니다. 이는 세 가지 로컬 언어 모델(Gemma 4 31B, Llama 3.3 70B, Qwen 3.5 122B MoE)을 OpenAI 호환 API(OpenAI-compatible API) 뒤로 래핑(wraps)하는 MLX 서버입니다. 설정 스크립트는 사용자의 하드웨어에 맞는 적절한 모델을 선택하여 다운로드하고, 바탕화면에 실행기(launcher)를 배치합니다. 세 번의 명령만으로 MacBook에서 310억 개의 파라미터(31-billion-parameter)를 가진 언어 모델을 실행할 수 있습니다.

이 글을 쓰는 시점을 기준으로 2,689개의 스타(stars)와 516개의 포크(forks)를 보유하고 있습니다. 라이선스(License)는 MIT입니다. 전체 프로젝트는 github.com/nicedreamzapp/claude-code-local 에서 확인할 수 있습니다.

그것이 엔진(engine)입니다. 제가 구축하지 못한 것은 퍼널(funnel, 깔때기)이었습니다.

한 달 동안 나를 괴롭힌 격차 (The gap that ate me for a month)

스타(Stars)는 "이거 정말 좋겠다"라고 생각하는 사람들입니다. 포크(Forks)는 작업을 시작한 사람들입니다. 하지만 둘 다 수익(revenue)으로 전환되지는 않습니다.

그 사례 연구를 읽으면서 눈에 띈 점은 다음과 같습니다. 66개의 에이전트를 연결할 수 있는 기술적 역량을 가진 변호사가 그 결과물을 제품화(productize)하지는 못했다는 점입니다. 그는 구매자 관계(그 자신이 구매자임)를 가지고 있고, 저는 시장 진입(go-to-market) 배경(수년간 소비자 하드웨어를 고객에게 직접 판매해 온 경험)을 가지고 있습니다. 아무도 출시하지 않고 있는 교차점은 바로 "이 스택이 사전 설치되어 법률 사무소로 배송되는 Mac mini"입니다.

그래서 저는 자리에 앉아 실제로 무엇이 빠져 있는지 지도로 그려보았습니다.

수치로 보는 시장 격차 (The market gap, in numbers)

저는 2026년 5월의 온디바이스 AI(on-device AI) 시장을 조사했습니다. 제가 찾아낸 결과는 다음과 같습니다:

  • 무료 오픈 소스 (OSS) (Ollama, LM Studio, Jan, Atomic Bot, 본인의 리포지토리): 포화 상태, 수익 발생 없음
  • 유료 Mac App Store 앱 (Private LLM, Enclave AI, Local LLM): 1회 결제 $10-30, 부트스트랩(bootstrapped) 방식의 2인 팀에게 실질적인 수익 제공
  • 데이터 보존 제로(zero-data-retention) 클라우드 SaaS (Spellbook, CoCounsel): 사용자당 월 $69-$149, 클라우드 기반이며 로컬이 아님
  • 기업용 법률 AI (Harvey): 사용자당 월 $1,200 이상
  • AI 네이티브 법률 사무소 (Manifest, Avantia, General Legal): 도구를 판매하는 것이 아니라
  1. Folder Watcher — ~/AirGap-Inbox/ 폴더에 PDF, 텍스트 또는 Markdown 파일을 넣으면 30초 이내에 _summaries/ 폴더에 구조화된 Markdown 요약본이 생성됩니다. 외부 의존성 없이 macOS의 textutil과 mdimport를 사용하여 PDF 및 docx를 처리합니다.

  2. Daily Briefing — 매일 아침 7:00에 LaunchAgent가 설정 파일에 나열된 폴더들을 읽고, 지난 24시간 동안 변경된 사항을 한 페이지 분량의 요약본(digest)으로 작성합니다.

  3. Local Q&A — CLI 명령어 airgap ask "질문 내용"을 사용합니다. ~/AirGap-Vault/를 BM25로 인덱싱하며(임베딩(embeddings)이나 벡터 데이터베이스(vector database) 없이도 첫날부터 바로 작동합니다), 사용자의 파일에 근거하여 답변합니다.

전체 세트는 약 300줄의 Python 코드로 구성되어 있습니다. 설치 프로그램은 더블 클릭만 하면 되는 .command 파일입니다. 적절한 하드웨어를 사용한다면 총 설치 시간은 60초 미만입니다.

저는 의도적으로 인증이 전혀 필요 없도록 설계했습니다. IMAP 자격 증명, OAuth 절차, API 키가 필요 없습니다. 설치 즉시 누구나 바로 사용할 수 있습니다. 자격 증명이 필요한 에이전트들(이메일 초안 작성, Reddit 모니터링, 캘린더 파싱)은 제 개인 기기에서 실행되며, AirGap Box에는 이들을 제대로 연결하기 위한 설정 호출(setup call) 단계가 포함되어 있습니다.

AirGap Box 구성 요소

귀하의 사무실로 배송되는 Mac mini에 동일한 스택이 구축되어 있습니다. 사전 설치 항목: claude-code-local MLX 서버, 3개의 핵심 에이전트, 자격 증명이 필요한 2개의 에이전트(이메일 초안 작성기, 프롬프트 라이브러리), 기본 차단 설정된 방화벽, 그리고 인쇄된 컴플라이언스(compliance) 메모 템플릿입니다.

Base ($2,995): Mac mini M4 16GB, Gemma 4 31B 사전 탑재.
Pro ($3,995): Mac mini M4 Pro 24GB, Llama 3.3 70B 사전 탑재.

두 모델 모두 90분간의 Zoom 설정 콜과 30일간의 이메일 지원을 포함합니다. 그 이후에는 즉시 사용 가능한 프라이빗 AI 워크스테이션을 갖게 됩니다. 저희는 데이터를 외부로 전송(phone home)하지 않습니다. 귀하의 데이터를 볼 수도 없습니다.

Base 모델의 매출원가(COGS)는 약 $940입니다. 마진은 약 69%입니다. Stripe를 통해 구매 시점에 결제되고 하드웨어는 그 후에 주문되므로 현금 흐름(cash-flow) 측면에서 안전합니다.

규모 확장 전 검증

저는 추측만으로 재고를 주문하지 않습니다. 계획은 다음과 같습니다:

  • Day 0: 대기 명단(waitlist)을 통해 Box 접근을 제한하여 공개 출시 (아직 결제 기능은 없음)
  • Day 7: 첫 번째 리뷰 — Box 대기 명단 가입자 수 확인
  • Day 14: Box에 대한 엄격한 게이트(hard gate) 적용 — 20개 이상의 인증된 이메일이 확보되지 않으면 포지셔닝(positioning)을 재검토함
  • Day 30: 전체 손익(P&L) 검토, 규모 확장(scale) 여부 결정

만약 14일 이내에 Box 대기 명단이 20명에 도달하면, 첫 3대의 Mac mini를 주문합니다. 만약 5명에 그친다면, 저는 해당 단계(rung)를 검증하지 못한 것이며, 하드웨어 비용을 지출하기 전에 포지셔닝을 재검토할 것입니다.

이 부분이 바로 사기꾼(grifter)들이 올리는 게시물에서 생략되는 부분입니다. "72시간 만에 월 14,200달러를 벌었습니다"와 같은 일은 정직한 비즈니스에서는 일어나지 않습니다. 정직한 비즈니스에서 일어나는 일은 "대기 명단을 열고, 2주 동안 가입자 수를 지켜본 뒤, 실제 수요에 기반하여 재고 주문 여부를 결정하고, 실제 수치를 보고하는 것"입니다.

정직한 1년 차 범위

비관적 (Pessimistic)현실적 (Realistic)낙관적 (Stretch)
1$0$400$2,000
...

사기꾼이 주장하는 월 14,000달러를 달성하려면, 모든 단계(rung)가 범위의 최상단 근처에서 성과를 내야 하며 동시에 컨설팅 계약도 성사되어야 합니다. 그것은 72시간 만에 일어나는 것이 아니라, 절제력을 가지고 12~18개월 차에 일어나는 일입니다.

제가 정직하게 공개할 내용

  • 주간 대기 명단 + 가입자 수 (허영 지표가 아닌 실제 수치)
  • 첫 환불 발생 시 (발생 시점) 및 그 이유
  • 첫 번째 Box 설치 사례 연구 (해당 기업의 허가 하에)
  • Box 대기 명단 → 주문 전환율 (발생하는 대로)

이 비즈니스가 작동하는지 보고 싶다면, github.com/nicedreamzapp/claude-code-local 및 AirGap 랜딩 페이지를 통해 지켜봐 주십시오. 수치가 발생하는 대로 게시하겠습니다.

링크

  • 무료 리포지토리 (Free repo): github.com/nicedreamzapp/claude-code-local
  • AirGap Box 대기 명단: nicedreamzwholesale.com/airgap-box
  • 데모 (Wi-Fi가 물리적으로 꺼진 노트북에서 NDA 검토 진행, 화면에 lsof 표시): youtube.com/watch?v=V_J1LpNGwmY

제가 이 글을 올리는 이유

이러한 사례 연구를 읽고 "나도 이걸 원해"라고 생각할 다음 사람이, MLX 설정에 관한 또 다른 Hacker News 스레드가 아니라 제품화된 버전을 만날 자격이 있다고 믿기 때문입니다. 그리고 제가 이 이야기를 정직하게 공개할 때마다, 그것은 저에게는 실질적인 무언가를 만들어냈다는 영수증이 되고, 다음 빌더(Builder)에게는 이 플레이북(Playbook)이 작동한다는 증거가 됩니다.

가격 책정, 포지셔닝(Positioning), 또는 에이전트(Agents)에 대한 피드백이 있다면 댓글을 남겨주세요. 모든 글을 읽고 있습니다.

저는 보안 업무를 처리하는 기업들을 위해 Mac mini에서 구동되는 사전 구성된 로컬 AI인 AirGap를 구축하고 있습니다. AirGap Box 대기 명단에 참여하거나, 무료 오픈 소스 스택을 가져가거나, 규정 준수가 민감한 기업(법률, 의료, 금융)을 위한 AirGap 컨설팅을 확인해 보세요.

AI 자동 생성 콘텐츠

본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0