Open Interpreter 리뷰 2026: 오프라인 코드 인터프리터 (Code Interpreter)

이 기사는 원래 aifoss.dev에 게시되었습니다.

요약 (TL;DR): Open Interpreter v0.4.3은 모든 LLM(대규모 언어 모델)에 Python, JavaScript 및 셸 명령어를 사용자의 기기에서 직접 작성하고 실행할 수 있는 능력을 부여합니다. 샌드박스(Sandbox) 없이 파일 시스템에 대한 전체 액세스 권한을 가집니다. 로컬 LLM 경로는 작동하지만 신뢰할 수 있는 출력을 위해서는 14B 이상의 모델이 필요합니다. 7B 모델은 실제 작업을 수행하기에 오류가 너무 많이 발생합니다. 클라우드 API 사용자(Claude 또는 GPT-4o)가 최고의 경험을 얻을 수 있으며, 로컬 우선 사용자는 그에 따라 기대치를 조정해야 합니다.

	Open Interpreter	Aider	Cline
최적 용도	시스템 작업, 파일 조작, 데이터 분석, OS 자동화	Git 네이티브 코드 편집, 다중 파일 리팩토링	VS Code 기반 자율 코딩 에이전트
...

솔직한 견해: 데이터 분석 스크립트, 파일 조작, 웹 스크래핑과 같이 LLM이 실제로 컴퓨터에서 무언가를 실행해야 할 때 Open Interpreter를 사용하세요. 순수하게 코드 편집만을 원한다면 Aider나 Cline이 더 나은 도구입니다.

Open Interpreter가 실제로 하는 일

ChatGPT의 Code Interpreter는 OpenAI의 서버에 있는 샌드박스 컨테이너 내부에서 코드를 실행합니다. 이는 사용자의 로컬 파일에 접근하거나, 시스템 패키지를 설치하거나, 웹을 탐색할 수 없습니다. 여러분이 돌려받는 것은 채팅창 내부의 결과물뿐입니다.

Open Interpreter는 이러한 모든 제약을 제거합니다. LLM이 CSV 파일을 분석하기 위해 Python 스크립트를 작성하면, 해당 스크립트는 사용자의 실제 파일 시스템에서 읽어 들여 실제 기기에서 실행됩니다. 패키지를 설치하면 사용자의 로컬 Python 환경에 설치됩니다. 격리 계층(Isolation layer)이 없으며, 이것이 바로 이 도구의 핵심이자 위험 요소입니다.

이 프로젝트는 OpenInterpreter 팀에 의해 유지 관리되며, AGPL-3.0 라이선스 하에 제공됩니다. GitHub 스타 63,000개 이상을 기록했으며, 현재 버전은 0.4.3입니다. Python 3.9부터 3.12까지 지원합니다.

두 가지 별개의 모드가 존재합니다:

Standard mode (표준 모드) — 사용자가 일반적인 영어로 작업을 입력하면, 모델이 이를 수행하기 위한 코드를 작성하고, 실행하기 전에 코드를 사용자에게 보여준 뒤 승인을 기다립니다. 승인 단계를 비활성화할 수 있지만(--yes 플래그), 기본 설정은 보수적입니다.

OS mode (OS 모드) (--os 플래그) — 모델이 스크린샷을 통해 사용자의 화면에 접근할 수 있으며, 마우스와 키보드를 제어하여 모든 GUI 애플리케이션과 상호작용할 수 있습니다. 단순히 터미널을 넘어, 데스크톱을 위한 "Jarvis"라고 생각하면 됩니다.

Installation (설치)

pip install open-interpreter

그게 전부입니다. Python 3.9 이상이 필요하며, 클라우드 API를 사용하는 경우 CUDA 설정은 필요하지 않습니다. 처음 실행할 때 API 키를 구성하거나 로컬 모델을 설정하라는 안내가 나타납니다.

Ollama 기반의 로컬 추론(local inference)을 사용하려면, Ollama를 별도로 설치하세요:

# Install Ollama (Linux)
curl -fsSL https://ollama.com/install.sh | sh

...

Standard Mode in Practice (표준 모드 실습)

기본 클라우드 설정(OpenAI 키 필요)으로 시작하세요:

interpreter

또는 Anthropic 키를 사용하여 실행하세요:

interpreter --model claude-opus-4-8

세션이 열리면 터미널 채팅 인터페이스가 나타납니다. 구체적인 작업을 요청해 보세요:

> Download the 10 most recent commits from my current git repo, format them as a markdown table, and save to commits.md
(현재 git 저장소에서 가장 최근의 커밋 10개를 다운로드하여 마크다운 표 형식으로 만들고 commits.md에 저장해줘)

모델은 subprocess를 사용하여 git log를 호출하는 Python 스크립트를 작성하고, 출력을 형식화한 뒤 파일을 작성합니다. 실행하기 전에 코드를 보여주며 "Would you like to run this?"라고 묻습니다. 이때 y를 누르면 실행됩니다. 결과는 터미널에 나타나고 파일은 디스크에 저장됩니다.

이러한 확인 루프(confirmation loop)는 적절한 기본 설정입니다. 이를 건너뛸 수도 있습니다:

interpreter --yes

하지만 빠르고 위험 부담이 적은 작업을 수행할 때만 이 방법을 사용하세요. 확인 절차가 없으면, 혼란에 빠진 모델이 의도하지 않은 동작을 수행할 수 있습니다.

Python API는 자신의 스크립트에 임베딩하기에 깔끔하게 설계되어 있습니다:

from interpreter import interpreter

interpreter.auto_run = True  # 승인 단계 건너뛰기
...

OS Mode: Full Computer Control (OS 모드: 완전한 컴퓨터 제어)

Version 0.4.0은 여기서 진정으로 이례적인 기능인 --os 모드를 출시했습니다. 표준 모드(Standard mode)는 셸(shell)에서 코드를 실행하지만, OS 모드는 사용자의 화면을 보고 마우스와 키보드를 제어할 수 있습니다.

interpreter --os

모델은 현재 디스플레이의 스크린샷을 전달받습니다. 이를 통해 다음과 같은 작업이 가능합니다:

UI 요소를 설명하여 클릭하기
텍스트 필드에 타이핑하기
스크롤, 드래그, 애플리케이션 열기
보이는 모든 창에서 텍스트 읽기

이 기능은 시각 능력을 갖춘 모델(Vision-capable model, 현재 Claude 또는 GPT-4V가 가장 적합하며, 시각 지원이 가능한 로컬 Ollama 모델도 기술적으로는 가능하지만 이 용도로는 신뢰도가 낮음)과 실시간 화면 캡처를 위한 screenpipe 통합 기술을 기반으로 작동합니다.

실제 활용 사례: "Excel을 열고, Q1 Sales라는 이름의 스프레드시트를 찾아 매출(revenue) 열의 합계를 구한 뒤, 그 결과를 B1 셀에 입력해줘."

모델은 파일로 이동하고, 올바른 셀을 클릭하고, 수식을 입력하는 방법을 스스로 파악합니다. 실제로 작동합니다. 하지만 UI 요소가 예상과 다른 위치에 있거나, 모델이 잘못 클릭하거나, 특정 문맥에서 수식 구문(syntax)이 틀리는 경우 등 작동하지 않는 순간도 있습니다. OS 모드는 진정으로 인상적이면서도 동시에 진정으로 취약합니다.

OS 모드 요구 사항:

시각 능력을 갖춘 모델 (클라우드 API 강력 권장)
터미널 애플리케이션에 화면 기록 권한 부여
macOS, Windows 또는 Linux (screenpipe는 세 운영체제 모두 지원)

이 프로젝트는 이를 명시적으로 실험적(experimental)이라고 부릅니다. 되돌릴 수 없는 작업에 대해 모니터링 없이 실행하지 마십시오.

Ollama를 이용한 로컬 실행

대화형 로컬 설정 마법사:

interpreter --local

이 명령은 로컬 Ollama 라이브러리에서 모델을 선택하고 API 엔드포인트를 자동 구성할 수 있는 모델 탐색기 메뉴를 실행합니다. GUI 없이 작업하고 싶다면 가장 빠른 방법입니다.

수동 구성을 원할 경우, CLI를 통해 다음과 같이 실행할 수 있습니다:

interpreter --model ollama_chat/codestral --api_base http://localhost:11434

또는 Python을 통해 다음과 같이 설정할 수 있습니다:

from interpreter import interpreter

interpreter.offline = True
...

context_window 재정의(override)에 유의하세요. Open Interpreter는 로컬 모드에서 기본적으로 3,000 토큰을 사용하는데, 이는 매우 보수적인 설정이며 이로 인해 모델이 다단계 작업(multi-step tasks)의 흐름을 놓칠 수 있습니다. 사용 중인 모델이 지원하는 실제 컨텍스트 창(context window) 크기로 값을 높이십시오.

프로필(Profiles)을 사용하면 미리 구성된 설정을 저장할 수 있습니다:

# 커뮤니티에서 제공하는 codestral 프로필 사용
interpreter --profile codestral.py

모델 추천: 솔직한 수치

프로젝트 문서에서는 신뢰할 수 있는 로컬 추론 (inference)을 위해 CodeLlama 13B Q8 및 DeepSeek Coder 33B Q4를 권장합니다. 커뮤니티 보고를 바탕으로 한 실제 분석 결과는 다음과 같습니다:

모델	필요한 VRAM	코드 신뢰도	최적 용도
Qwen2.5-Coder 7B	~6GB	낮음 — 루프 발생, 구문 오류	단순 파일 작업 전용
...

7B 모델은 "이 폴더 내의 ".log"로 끝나는 모든 파일 이름을 ".bak"로 변경해줘"와 같은 유형의 작업을 안정적으로 처리할 수 있습니다. 하지만 다단계 로직, 오류 수정, 또는 코드베이스 구조에 대한 이해가 필요한 작업에서는 한계를 보입니다.

RTX 4090 (24GB VRAM)은 Devstral 또는 DeepSeek Coder 33B Q4를 허용 가능한 속도로 로컬에서 실행하기 위한 최적의 선택(sweet spot)입니다. Q4 양자화 (quantization) 기준으로 초당 15~30 토큰을 기대할 수 있습니다. RTX 3090은...