AI 코딩 에이전트가 시니어 엔지니어링 워크플로우를 따르도록 만드는 오픈 프로토콜을 구축했습니다
요약
AI 코딩 에이전트가 시니어 엔지니어의 워크플로우를 준수하도록 설계된 오픈 소스 프로토콜인 'The Polyglot Protocol'을 소개합니다. 저장소 탐색, 컨벤션 준수, 검증 과정을 포함하여 에이전트의 흔한 실패 모드를 방지하는 데 중점을 둡니다.
핵심 포인트
- AI 에이전트의 임의적인 API 생성 및 컨벤션 무시 문제 해결
- 22개 언어 지원 및 코드 생성 전후의 체크리스트 제공
- Codex, Claude Code 등 다양한 모델에 적용 가능한 모델 불가지론적 설계
- 저장소 조사, 검증, 최종 감사 점수 산출 프로세스 포함
AI 코딩 에이전트(AI coding agents)는 빠르게 발전하고 있지만, 저는 계속해서 동일한 실패 모드(failure modes)에 직면했습니다:
- 저장소 탐색(repository discovery)을 건너뜀
- 존재하지 않는 API, 플래그 또는 설정 키를 임의로 만들어냄
- 기존 프로젝트 컨벤션(conventions)을 무시함
- 불필요한 인프라를 추가함
- 검증(validation)을 건너뜀
- 지원되지 않는 체크 항목을 조용히 완료된 것으로 처리함
- 최종 코드베이스 감사(codebase audit) 없이 작업을 종료함
그래서 저는 'The Polyglot Protocol'을 구축했습니다. 이것은 다양한 언어로 구성된 코드베이스(polyglot codebases)에서 작동하는 AI 코딩 에이전트를 위한 오픈 소스 시니어 엔지니어 워크플로우 프로토콜입니다.
Repo: https://github.com/sabir-gbs/the-polyglot-protocol
포함된 내용:
- 22개 언어에 대한 가이드라인
- 언어 선택 규칙
- 코드 생성 전(pre-codegen) 체크리스트
- 생성 금지(do-not-generate) 정책
- 검증 스크립트(validation scripts)
- Codex, Claude Code, OpenCode를 위한 어댑터(adapters)
- 코드 생성 후(post-codegen) 감사 점수(audit scoring)
핵심 아이디어
에이전트가 코드를 변경하기 전에 다음을 수행해야 합니다:
- 저장소를 조사(inspect)할 것
- 기존 컨벤션을 보존할 것
- 적절한 언어와 도구를 선택할 것
- 임의로 만들어낸 API나 의존성(dependencies)을 피할 것
- 결과를 검증할 것
- 지원되지 않는 체크 항목을 명시적인 N/A로 문서화할 것
- 최종 감사(final audit)와 함께 종료할 것
설계상 모델 불가지론적(Model-agnostic) 방식
저는 프런티어 모델(frontier models)뿐만 아니라 Qwen, Grok, Kimi, MiniMax 등의 모델로 이 프로토콜을 테스트했습니다. 핵심은 하나의 모델에 의존하지 않는 것입니다. 강력한 모델이라도 더 엄격한 엔지니어링 규율(engineering discipline)로부터 이득을 얻으며, 더 작거나 로컬에서 실행되는 모델은 더 명확한 제약 조건(constraints)으로부터 이득을 얻습니다.
왜 오픈 소스로 공개하나요?
저는 개발자들이 적응시키고, 비판하고, 개선할 수 있는 실용적이고 검사 가능한 프로토콜을 원합니다. 만약 여러분이 Codex, Claude Code, OpenCode, Cursor, Aider 또는 유사한 에이전트를 사용한다면, 다음과 같은 피드백을 듣고 싶습니다:
- 프로토콜이 너무 엄격한가요?
- 어떤 가드레일(guardrails)이 누락되었나요?
- 무엇이 선택 사항이어야 하고 무엇이 필수 사항이어야 할까요?
- 무엇이 이 프로토콜의 도입을 더 쉽게 만들 수 있을까요?
AI 자동 생성 콘텐츠
본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기