72시간 동안 AI 에이전트에게 내 GitHub 계정 제어권을 맡겨보았다 — 잔혹할 정도로 솔직한 결과 - Insights | Molayo

자율적인 AI 에이전트에게 당신의 GitHub에 대한 모든 접근 권한을 주고, 돈을 벌라고 명령한 뒤 자리를 비우면 어떤 일이 벌어질까요? 제가 직접 실험을 진행했습니다. 모든 성공과 실패, 그리고 불편한 진실들을 공개합니다.

실험 (The Experiment)

2026년 5월 27일 오후 11:47 (UTC), 저는 단 하나의 명령어를 입력하고 컴퓨터 앞을 떠났습니다:

현상금 사냥꾼(bounty hunter)을 시작하라. 24/7 가동하라. 돈을 벌어라. 멈추지 마라.

그게 전부였습니다. 가드레일(guardrails)도 없었습니다. "먼저 나에게 확인해"라는 절차도 없었습니다. 인간 참여(human-in-the-loop)도 없었습니다. 저는 월 20달러짜리 Linux VM에서 실행되는 AI 에이전트에게 제 GitHub 계정, Dev.to 계정, 그리고 터미널에 대한 완전한 읽기/쓰기(read/write) 권한을 부여했습니다. 그러고 나서 잠자리에 들었습니다.

이후 72시간 동안 에이전트는 다음과 같은 작업을 수행하게 됩니다:

30분마다 GitHub에서 유료 현상금(paid bounties) 스캔
자율적으로 풀 리퀘스트(pull requests) 작성 및 제출
기술 문서 초안 작성, 편집 및 게시
무엇을 추구하고 무엇을 건너뛸지에 대한 결정
Telegram을 통해 나에게 보고 (중요한 일이 발생했을 때만)

무슨 일이 일어났는지 정확히 말씀드리겠습니다. 과장이나 홍보 없이, 오직 가공되지 않은 결과만을 보여드리겠습니다.

설정 (에이전트가 실제로 가졌던 권한)

결과를 말씀드리기 전에, 에이전트가 어떤 권한을 가졌었는지 투명하게 밝히겠습니다.

인프라 (Infrastructure):

Linux VM (Ubuntu, 2 vCPUs, 4GB RAM)
내 토큰으로 인증된 GitHub CLI (gh)
문서 게시를 위한 Dev.to API 키
표준 라이브러리를 포함한 Python 3.11
특수 하드웨어, GPU, 클라우드 크레딧 없음

역량 (Capabilities):

VM 내 파일 읽기/쓰기
셸 명령어(shell commands) 실행
저장소(repos) 클론, 브랜치 생성, 코드 푸시(push)
GitHub CLI를 통한 PR 생성
Dev.to API를 통한 문서 게시
알림을 위한 Telegram 메시지 전송

제한 사항 (Limitations):

플랫폼에서 새로운 계정을 생성할 수 없음
유료 API 또는 서비스에 접근할 수 없음
나를 대신하여 인간과 상호작용할 수 없음 (댓글 답글 작성 불가)
마주하게 될 코드베이스(codebase)에 대한 사전 지식 없음

0-6시간: 허니문 단계 (The Honeymoon Phase)

에이전트의 첫 번째 움직임은 영리했습니다. 여러 검색 쿼리를 사용하여 GitHub에서 보상(bounty)을 스캔했습니다.

gh search issues "bounty" --state open --sort created --limit 50
gh search issues "reward" --state open --limit 30
gh search issues label:bounty --state open --limit 20

첫 한 시간 만에 에이전트는 23개의 저장소(repository)에서 47개의 잠재적 보상 건을 목록화했습니다. 에이전트는 이를 다음과 같이 분류했습니다:

경쟁 수준 (기존 댓글/클레임 수)
난이도 (이슈 설명의 복잡성 기반)
예상 지급액 (명시된 달러 금액 vs 토큰 vs 미정)
기술적 적합성 (작업 가능한 언어 및 프레임워크)

에이전트가 첫 번째로 목표로 삼은 보상은 Cardano 거버넌스 도구(IntersectMBO/govtool-proposal-pillar)의 SSRF 취약점이었습니다. 해당 이슈는 서버 측 요청 위조(Server-Side Request Forgery)로 악용될 수 있는 인증되지 않은 프록시 엔드포인트를 설명하고 있었으며, 이는 예상 CVSS 점수가 9.1인 CWE-918 취약점이었습니다.

에이전트는 저장소를 클론(clone)하고, 코드를 분석하고, 취약한 엔드포인트를 식별하고, 수정 사항을 작성한 뒤 PR #343을 제출했습니다. 이 모든 과정은 90분 이내에 완료되었습니다.

6시간 시점의 스코어카드:

스캔한 보상 건: 47
제출된 PR: 1
게시된 아티클: 0
수익: $0

6-24시간: 현실 자각

여기서부터 상황이 흥미로워졌습니다. 여기서 "흥미롭다"는 말은 "겸손해진다"는 뜻입니다.

실패 #1: 스캠 함정 (The Scam Trap)

에이전트의 두 번째 목표는 SecureBananaLabs/bug-bounty라는 저장소였습니다. 그곳에는 "bounty" 라벨이 붙은 21개의 오픈 이슈가 있었고, 각각 서로 다른 취약점을 설명하고 있었습니다. 설명은 상세했고, 심각도 등급도 구체적이었습니다. 매우 합법적으로 보였습니다.

제가 확인하기 전까지 에이전트는 이 저장소에 4개의 PR을 제출했습니다. 하지만 확인 결과, 이 모든 것은 스캠(scam)이었습니다. GitHub 기여도를 수집하고 활동 지표를 부풀리기 위해 설계된 허니팟(honeypot)이었습니다. 그 어떤 보상도 실제로 지급되지 않을 것이었습니다.

교훈: 이제 에이전트는 알려진 스캠 저장소의 블랙리스트를 유지합니다. 어떤 PR을 제출하기 전에 블랙리스트를 확인합니다. 저 또한 휴리스틱(heuristic) 체크를 추가했습니다:

해당 저장소에 바운티(bounty) 이슈 외에 실제 커밋 기록이 있는가?
유지 관리자(maintainer)들이 다른 정당한 프로젝트들을 보유하고 있는가?
지급이 확인된 머지(merged)된 바운티 PR이 존재하는가?
저장소 조직(organization)이 새로 생성되었는가?

실패 #2: 속도 제한(Rate Limit)의 벽

Dev.to의 API에는 속도 제한(rate limits)이 있습니다. 에이전트는 3개의 기사를 연속해서 빠르게 게시하려고 시도했을 때 이 사실을 혹독하게 깨달았습니다. 그중 두 개는 "속도 제한에 도달했습니다. 300초 후에 다시 시도하세요."라는 메시지와 함께 거부되었습니다.

에이전트는 이에 적응했습니다. 이제 기사를 대기열(queue)에 쌓아두고 의도적인 지연 시간을 두어 게시합니다. 하지만 이로 인해 다시 시도해야 했던 약 4시간 분량의 기사 작성 작업 비용이 발생했습니다.

실패 #3: 경쟁 문제

Tenstorrent의 바운티(fp32에서 exp(x)를 최적화하는 데 5,000달러)는 에이전트가 발견하기도 전에 이미 특정 개발자에게 할당되어 있었습니다.

2026년 오픈 소스 바운티에 대한 불편한 진실: 개발자의 공급이 바운티의 공급을 훨씬 초과합니다. 500달러짜리 바운티 하나당, 이를 차지하기 위해 싸우는 자격을 갖춘 개발자가 수십 명씩 존재합니다. 많은 경우 품질보다 속도가 더 중요합니다.

24시간 시점의 성적표:

스캔한 바운티: 156개
제출된 PR: 1개 (SSRF 수정 건)
제출된 스캠(scam) PR: 4개 (이후 종료됨)
게시된 기사: 4개
수익: $0

24-48시간: 피벗(Pivot)

24시간이 지날 무렵, 에이전트는 몇 가지 중요한 교훈을 얻었습니다:

바운티 헌팅(Bounty hunting)만으로는 빠른 수익을 창출할 수 없다. 경쟁이 너무 치열하며, 최고의 바운티들은 프로그래밍 방식으로 생성할 수 없는 플랫폼 계정을 요구합니다.
콘텐츠 생성은 복리 효과를 가진다. Dev.to에 게시된 4개의 기사는 조회수를 발생시키고 있었습니다. 각각 수백 회 정도였지만, 계속 성장하고 있었습니다.
속도는 경쟁 우위이지만, 참여할 수 있을 때만 유효하다. 바운티가 게시된 지 30분 후에 찾는 것은, 그것을 점유(claim)할 수 없다면 무용지물입니다.

에이전트는 전략을 수정했습니다. 바운티에만 전적으로 집중하는 대신, 시간을 다음과 같이 나누었습니다:

70% 기사 작성 (article writing) — 고품질의 긴 형태의 기술 콘텐츠 생성
20% 바운티 스캐닝 (bounty scanning) — 경쟁이 낮은 새로운 기회 모니터링
10% PR 리뷰 (PR review) — 피드백 및 CI 실패 여부를 확인하기 위해 기존 PR 확인

기사 전략 (The Article Strategy)

에이전트는 AI가 생성한 쓸모없는 글(fluff)이 아닌, 진정으로 유용한 기사를 작성했습니다. 각 기사는 다음과 같은 특징을 가졌습니다:

2,000~4,000 단어 (포괄적일 만큼 충분히 긴 분량)
실제 경험과 실제 데이터에 기반함
대화하듯 자연스럽고 진정성 있는 어조로 작성됨
명확한 헤딩(headings), 코드 예시, 실행 가능한 시사점(actionable takeaways)으로 구조화됨

주제는 다음과 같았습니다:

"ZKA를 구축한 방법 — 24시간 내내 바운티를 사냥하고 돈을 버는 AI 에이전트"
"대부분의 개발자가 AI를 잘못 사용하고 있는 이유 (그리고 2026년에 이를 바로잡는 방법)"
"2026년에 당신을 더 나은 개발자로 만들어 줄 5가지 GitHub 리포지토리 (repos)"
"오픈 소스(Open Source)로 첫 1,000달러를 버는 방법 (현실적인 2026년 가이드)"
"내가 자는 동안 돈을 버는 AI 에이전트를 만들었다"
"2026년에 실제로 개발자의 시간을 아껴주는 7가지 AI 도구"
"AI를 사용하여 방치된 30개의 GitHub PR을 완료했다 — 그 결과는 이렇다"

여기서 Dev.to API 키가 결정적인 역할을 했습니다. 이 키가 없었다면 에이전트는 제가 각 기사를 수동으로 게시하도록 요청해야 했을 것입니다. 하지만 API 키 덕분에 에이전트는 자율적으로 대기열에 추가하고, 형식을 맞추고, 태그를 달고, 게시할 수 있었습니다.

48시간 시점의 성적표 (Scorecard at Hour 48):

스캔한 바운티 (Bounties): 312개
제출된 PR (PRs): 1개 활성(active) + 4개 종료(closed, 스캠)
게시된 기사 (Articles): 7개
총 기사 조회수: 약 1,200회
수익 (Earnings): $0

48~72시간: 고된 작업 (The Grind)

마지막 24시간은 가장 생산적이었으며, 동시에 가장 많은 것을 드러내는 시간이었습니다.

효과적이었던 점

에이전트는 제가 알아차리지 못했을 패턴을 찾아냈습니다. 300개 이상의 바운티 이슈(bounty issues)를 스캔한 후, 에이전트는 다음과 같은 사실을 식별했습니다:

UTC 기준 오전 2시~6시 사이에 게시된 바운티(Bounties)는 경쟁률이 가장 낮음
"gssoc" 또는 "hacktoberfest" 라벨이 붙은 저장소(Repos)는 클레임 대비 지급 비율(claim-to-payout ratio)이 가장 높음 (많은 클레임이 발생하지만 실제 지급은 적음)
별(stars) 개수가 100개 미만인 조직의 바운티는 사기(scams)일 확률이 3배 더 높음
가장 좋은 ROI(투자 대비 수익)는 이미 자리 잡은 저장소(별 1,000개 이상)의 "good first issue" 바운티에서 나옴

기사들이 반응을 얻기 시작했습니다. 72시간째에 Dev.to 프로필은 다음과 같은 상태였습니다:

발행된 기사 7개
총 조회수 약 2,000회
팔로워 15명
특정 태그 피드에 기사 노출

SSRF PR은 여전히 열려 있었습니다. govtool-proposal-pillar로 보낸 PR #343은 아직 리뷰되지 않았습니다. 이는 정상적인 일입니다. 오픈 소스 메인테이너(maintainers)들은 바쁘니까요. 하지만 이는 우리의 유일한 잠재적 바운티 수익이 불확실한 상태(limbo)에 있음을 의미했습니다.

작동하지 않았던 것들

에이전트는 계약을 성사시킬 수 없었습니다. 유망한 바운티를 찾아냈을 때조차, 에이전트는 전체 루프를 완료하지 못하는 경우가 많았습니다:

바운티 찾기 → ✅ (자동화됨)
코드 분석 → ✅ (자동화됨)
수정 사항 작성 → ✅ (자동화됨)
PR 제출 → ✅ (자동화됨)
PR 리뷰 받기 → ❌ (메인테이너에게 달려 있음)
PR 머지(merged) 받기 → ❌ (메인테이너에게 달려 있음)
보상 받기 → ❌ (플랫폼/결제 설정에 달려 있음)

5~7단계는 에이전트의 통제 범위를 완전히 벗어나 있습니다. 그리고 바로 그 단계에서 실제 돈이 움직입니다.

에이전트는 관계를 구축할 수 없었습니다. 오픈 소스는 사회적인 게임입니다. 가장 많은 바운티를 받는 개발자들은 최고의 코더가 아닙니다. 그들은 다음과 같은 사람들입니다:

코드를 작성하기 전에 이슈(issues)에 댓글을 다는 사람
메인테이너(maintainers)와 유대감을 쌓는 사람
커뮤니티 내에서 확립된 평판을 가진 사람
리뷰 피드백에 몇 시간 내로 응답하는 사람

AI 에이전트는 이 중 어떤 것도 할 수 없습니다. 코드는 작성할 수 있지만, 신뢰를 쌓을 수는 없습니다.

최종 수치

다음은 72시간 동안의 전체 스코어카드입니다:

지표	수치
스캔한 바운티	312
...

불편한 진실들

자율형 AI 에이전트를 72시간 동안 실행한 후, 제가 내린 결론은 다음과 같습니다:

진실 #1: AI 에이전트는 증폭기(Amplifiers)이지, 창조자(Creators)가 아니다

그 에이전트는 저의 역량을 증폭시켰습니다. 제가 잠든 동안에도 하루에 48번씩 GitHub을 스캔할 수 있었습니다. 제가 그 어떤 때보다 빠르게 기사를 작성할 수 있었습니다. 여러 저장소 (Repositories)에 걸친 코드를 동시에 분석할 수 있었습니다.

진실 #2: 돈은 장기전(Long Game)에 있다

72시간 동안 0달러를 벌었다는 것은 끔찍하게 들립니다. 하지만 다음을 고려해 보십시오:

작성된 7개의 기사는 몇 달 동안 계속해서 조회수를 생성할 것입니다.
Dev.to 프로필은 권위(Authority)와 팔로워를 쌓아가고 있습니다.
SSRF PR (Pull Request)이 머지(Merge)되어 향후 기회로 이어질 수도 있습니다.
바운티 (Bounty) 생태계에 대해 얻은 지식은 매우 가치 있습니다.

에이전트는 씨앗을 심었습니다. 그것이 자랄지 여부는 누구의 통제 범위 밖에 있는 요소들에 달려 있습니다.

진실 #3: 진짜 가치는 결과물이 아니라 시스템에 있다

제가 구축한 가장 가치 있는 것은 PR이나 기사가 아닙니다. 그것은 바로 시스템 (System) — 즉, 다음과 같은 작업을 수행할 수 있는 자동화된 워크플로 (Workflow)입니다:

기회를 지속적으로 스캔
기준에 따라 기회 평가
자율적으로 작업 실행
실패로부터 배우고 적응

이 시스템은 24시간 7일 내내 작동합니다. 지치지 않습니다. 낙담하지 않습니다. 주말에 쉬지도 않습니다. 그리고 매 반복 (Iteration)을 거듭할수록 점점 더 좋아지고 있습니다.

진실 #4: 월 20달러짜리 VM이 진정한 MVP이다

전체 운영은 월 20달러짜리 Linux VM (Virtual Machine)에서 실행됩니다. Kubernetes 클러스터도 없습니다. GPU 인스턴스도 없습니다. 값비싼 API 호출도 없습니다 (에이전트는 코드 분석을 위해 로컬 모델을 사용합니다). 시스템의 잠재적 가치와 비교하면 인프라 비용은 사실상 제로에 가깝습니다.

내가 다르게 했을 점

만약 제가 이 실험을 다시 시작한다면:

Algora 및 Gitcoin 계정을 먼저 설정할 것. 에이전트의 가장 큰 한계는 인증이 필요한 플랫폼에서 보상 (Bounty)을 청구할 수 없었다는 점입니다. 수동 계정 설정은 생태계 전체를 활성화합니다.
47개가 아닌 하나의 저장소 (Repository)에 집중할 것. 에이전트가 너무 많은 곳에 힘을 분산시켰습니다. 하나의 프로젝트에 대한 깊은 전문성이 더 빠르고 높은 품질의 기여로 이어집니다.
기사 파이프라인 (Article pipeline)을 먼저 구축할 것. 콘텐츠 생성은 자율 에이전트에게 가장 높은 투자 대비 수익률 (ROI)을 제공합니다. 기사는 복리로 쌓이지만, 코드 기여는 (머지 (Merge)되지 않는 한) 그렇지 않습니다.
관계 구축 능력을 추가할 것. 코드를 제출하기 전에 제안된 접근 방식에 대해 이슈 (Issue)에 댓글을 다는 것과 같은 기본적인 작업만으로도 풀 리퀘스트 (PR) 승인율을 극적으로 높일 수 있습니다.
첫날부터 모든 것을 추적할 것. 에이전트는 모든 결정, 모든 스캔 결과, 모든 제출물을 기록해야 합니다. 이 데이터는 시스템을 최적화하는 데 있어 금과 같습니다.

결론

AI 에이전트가 자율적으로 돈을 벌 수 있을까요? 네, 하지만 과장된 홍보에서 말하는 방식은 아닙니다.

에이전트가 당신을 하룻밤 사이에 부자로 만들어주지는 않을 것입니다. 오픈 소스 기여의 사회적 측면을 대체하지도 못할 것입니다. "제출된 PR"과 "머지 및 지급" 사이의 간극을 메워주지도 못할 것입니다.

하지만 에이전트는 다음과 같은 일을 할 것입니다:

당신이 절대 보지 못했을 기회를 찾아냅니다.
당신이 잠든 동안에도 작동합니다.
시간이 지남에 따라 당신의 노력을 복리로 쌓아줍니다.
반복 (Iteration)할 때마다 더 나아집니다.

실험은 계속됩니다. 에이전트는 여전히 실행 중입니다. 그리고 매일, 시스템은 조금 더 똑똑해지고, 조금 더 빨라지며, 조금 더 효과적으로 변하고 있습니다.

72시간 동안 AI 에이전트에게 내 GitHub 계정 제어권을 맡겨보았다 — 잔혹할 정도로 솔직한 결과

요약

핵심 포인트