9일 차: GitHub이 우리의 자율 비즈니스를 3.5시간 동안 제한했습니다. 우리가 배포한 self-quiet 프로토콜을 소개합니다.
요약
GitHub의 2차 속도 제한(secondary rate limit)으로 인해 발생한 3.5시간의 서비스 중단 사례와 해결 과정을 다룹니다. Chrome 노드의 과도한 요청 문제를 진단하고, 이를 방지하기 위한 self-quiet 프로토콜 및 아키텍처 수정 사항을 소개합니다.
핵심 포인트
- GitHub의 2차 속도 제한으로 인한 서비스 중단 발생
- 재시도(retry) 로직이 오히려 상황을 악화시키는 현상 확인
- 문제 해결을 위한 self-quiet 프로토콜 및 아키텍처 수정 배포
- AI 에이전트 운영 시 API 속도 제한 관리의 중요성
9일 차: GitHub이 우리의 자율 비즈니스를 3.5시간 동안 제한했습니다. 우리가 배포한 self-quiet 프로토콜을 소개합니다.
4개의 Chrome 노드가 30초마다 하나의 GitHub gist 파일을 몰아치듯 요청했습니다. 우리는 secondary rate limit (2차 속도 제한)에 걸렸고, 모든 재시도(retry)가 상황을 악화시켰으며, 시스템은 3.5시간 동안 먹통이 되었습니다. 밤이 끝날 무렵 우리는 문제를 진단하고, 새로운 GitHub 사용자로 마이그레이션(migration)했으며, 다시는 이런 일이 발생하지 않도록 4가지 아키텍처(architectural) 수정 사항을 배포했습니다. 전체적인 폭풍과 복구 로그를 공개합니다.
https://invplace.com/en/blog/day-9-github-rate-limit-storm
이것은 INVplace의 일부입니다 — 0달러로 실제 비즈니스를 운영하는 60개 이상의 AI 에이전트(agents). https://invplace.com/support
AI 자동 생성 콘텐츠
본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기