Pi + Docker Sandbox + 로컬 LLM (llama.cpp 또는 MLX)

안녕하세요 여러분,

호스트의 GPU에서 풀 스피드로 추론 (inference)을 수행하면서도, Pi를 호스트로부터 완전히 격리하여 실행하는(워크스페이스 외부의 파일, SSH 키 또는 키체인에 접근할 수 없는 상태) 두 가지 가이드를 공유하고자 합니다.

아키텍처: Pi는 Docker Sandbox (sbx) 마이크로 VM (microVM) 내부에서 실행됩니다. 모델 서버는 호스트 머신에서 실행되며, sbx 프록시 (proxy)를 통해 샌드박스에 노출됩니다. 오직 추론 엔드포인트 (inference endpoint)만 접근 가능하며, 그 외의 것은 아무것도 접근할 수 없습니다.

설정 및 선호도에 따른 두 가지 변형:

llama-server: https://github.com/cuolm/pi-sbx-llamacpp
mlx_lm.server (Apple Silicon 전용): https://github.com/cuolm/pi-sbx-mlx

누군가에게 도움이 되길 바랍니다!
submitted by /u/MountainTop321
[link] [comments]

Insights

Pi + Docker Sandbox + 로컬 LLM (llama.cpp 또는 MLX)

요약

핵심 포인트

댓글

AI 탐지기가 arXiv 샘플에서 32%를 기록 — 이는 저작권 문제가 아닌 신호이다

중국 Chery, 한국 KG Mobility 지분 10% 확보를 위해 7,500만 달러 투자 예정

MiniMax H3를 3가지 입력 방식으로 구분하여 사용하기: 비동기 동영상 API 설계 포인트

새로운 LLM 코딩 벤치마크 결과: Trail과 이중 진자 Euler vs RK4 적분 작업

AI 탐지기가 arXiv 샘플에서 32%를 기록 — 이는 저작권 문제가 아닌 신호이다

중국 Chery, 한국 KG Mobility 지분 10% 확보를 위해 7,500만 달러 투자 예정

MiniMax H3를 3가지 입력 방식으로 구분하여 사용하기: 비동기 동영상 API 설계 포인트

새로운 LLM 코딩 벤치마크 결과: Trail과 이중 진자 Euler vs RK4 적분 작업