repo-slopscore: 커밋 기록 분석으로 Git 저장소의 AI/LLM 기여 감지
요약
repo-slopscore는 Git 커밋 기록을 분석하여 AI 및 LLM의 기여도를 감지하는 도구입니다. GitHub을 포함한 다양한 Git 호스팅 플랫폼을 스캔하며, 오픈소스 프로젝트의 AI 사용 여부를 점수로 나타냅니다.
핵심 포인트
- Git 커밋 기록 분석을 통해 AI/LLM 기여도를 감지
- GitHub, Codeberg, Bitbucket 등 다양한 호스팅 지원
- AI 기여도에 따른 점수 산출 및 저장소 스캔 기능 제공
- 단순 커밋 신호 기반 점수 산출로 인한 통계적 왜곡 가능성 존재
repo-slopscore는 Git 저장소의 커밋 기록을 분석해 AI/LLM 기여를 감지하는 도구로 소개됨
서비스는 홈, 저장소 스캔, 소스 코드 링크를 제공하며 소스 코드는 codeberg.org/polyphony/repo-slopscore에 공개됨
스캔된 전체 저장소 수는 3058개로 표시되며, 최근 스캔 목록은 저장소 URL과 UTC 분석 시각을 함께 보여줌
스캔 대상은 GitHub뿐 아니라 Codeberg, Bitbucket, SourceHut, git.kernel.org, chromium.googlesource.com 등 여러 Git 호스팅을 포함함
일부 저장소는 슬래시나 .git 접미사 차이로 중복형 항목이 존재해, 목록 해석 시 URL 정규화 차이를 고려해야 함
핵심 요지
repo-slopscore는 커밋 기록 분석을 기반으로 Git 저장소의 AI/LLM 기여를 감지하는 서비스로 소개됨
공개 페이지는 저장소 스캔 기능, 최근 스캔된 저장소 목록, 소스 코드 링크를 제공함
전체 스캔 저장소 수는 3058개로 표시됨
최근 스캔 목록에는 helix-editor/helix, Agoric/Agoric-sdk, FiloSottile/age, github/copilot-cli, fish-shell/fish-shell, tmux/tmux, httpie/cli 등이 포함됨
각 스캔 결과 링크는 slopscan.ava.pet/repo/ 아래에 URL 인코딩된 원본 저장소 주소를 붙인 형태로 구성됨
중요한 맥락
스캔 대상은 GitHub에 한정되지 않으며, Codeberg, Bitbucket, SourceHut, git.kernel.org, chromium.googlesource.com, gcc.gnu.org, gerrit.wikimedia.org, git.ffmpeg.org 같은 여러 호스팅 도메인을 포함함
목록에는 OpenRGB, coreboot, gentoo/gentoo, guix/guix, wlroots, forgejo, ziglang/zig, FFmpeg, FreeCAD, WebKit, NixOS/nixpkgs 같은 알려진 오픈소스 프로젝트가 포함됨
보안·시스템·인프라 관련 저장소로 Mbed-TLS/mbedtls, OpenVPN/openvpn, WireGuard/wireguard-windows, Yubico/yubikey-manager, NationalSecurityAgency/ghidra, ReFirmLabs/binwalk 등이 표시됨
AI 또는 slop 관련 이름을 가진 저장소도 목록에 있으며, anthropics/claude-code, anthropics/claudes-c-compiler, codeberg.org/brib/slopfree-software-index, codeberg.org/jruz/slop-detector 등이 포함됨
분석 시각은 2026년 5월 초부터 2026년 6월 14일 00시대 UTC까지 분포하며, 최근 스캔 목록은 2026년 6월 13일 23:22:37 +0000부터 2026년 6월 14일 00:36:00 +0000까지의 항목을 보여줌
aur.archlinux.org/yay와 aur.archlinux.org/yay.git, TeamNewPipe/NewPipe와 TeamNewPipe/NewPipe/처럼 같은 프로젝트가 다른 URL 형태로 별도 항목에 나타나는 사례가 있음
다른 사람이 만든 걸 부정적으로 말하고 싶진 않지만, 이 프로젝트는 부정성이 목적처럼 느껴짐
동의하지 않는 도구나 방식으로 만들어졌거나 그런 기여를 받는 소프트웨어 프로젝트에 대한 경멸을 자동화하는 도구처럼 보임
채점도 유용하지 않음. nixpkgs gets a 0 (F) score는 AI 사용을 시사하는 “커밋 신호”가 228개라서 0점을 받았지만, nixpkgs repository에는 현재 커밋이 1,016,046개 있음. 전체의 0.022%만으로 0점이 되는 셈임 Bevy gets a 97 (A+) score도 100점이 아닌 이유가 “co-authored by Claude” 주석이 붙은 single pull request 하나 때문임. PR이 좋았는지, 메인테이너가 병합할 때 “co-authored by” 주석을 못 봤는지, Bevy에 합리적인 AI 기여 정책이 있는지는 반영되지 않음
핵심은 이 도구가 맥락과 뉘앙스를 버린다는 점임. 우려가 있을 때 사람이 직접 프로젝트를 살펴보고, 메인테이너가 무엇을 생각하는지, 프로젝트를 만드는 사람들이 어떤 이유와 감정을 가졌는지 알아볼 필요를 없애버림. URL을 넣으면 점수만 나옴
“slop”이라는 단어의 함의와 가혹한 채점 때문에 의도적으로 부정적으로 느껴지고, AI 도움을 받은 경우까지 포함해 소프트웨어 생산에 들어간 인간의 판단과 요소를 단일 점수로 뭉개려 해서 비인간적으로도 느껴짐. 다른 사람들이 만드는 소프트웨어와 그 방식에 관심이 큰 프로젝트라면, 이 도구와 제작 과정에는 배려와 사려가 부족해 보임
이 일 때문에 사람들이 나를 괴롭히게 될까 봐 걱정됨. 올해가 이미 힘든 해였음
신호가 꽤 취약한 기준에 의존하는 것 같음. LLM 생성 코드와 사람이 쓴 코드가 50:50인 저장소를 넣어봤는데, 공동 서명된 커밋이 없어서 agents.md만 근거로 잡히고 95점이 나옴
실제 코드를 보고 LLM 흔적을 잡아내는, 팬그램에 가까운 방식일 줄 기대했음
이 프로젝트의 목적은 데이터를 투명하게 만드는 것임. 즉 “커밋 이력이나 소스 트리에서 LLM 사용 흔적이 보이는가?”라는 데이터임
어떤 도구도 만능은 아니지만, 이 정보 발견을 쉽게 해줌. 그 정보를 어떻게 쓸지는 사용자에게 달려 있음. “slop”이라는 표현은 문제 있다는 데 동의하지만, 나머지 비판에는 동의하지 않음
오픈소스 커뮤니티의 큰 부분이 얼마 전까지 자신들이 맞서 싸우던 모습이 되어버린 듯해서 매우 슬픔
이런 도구가 모든 것을 무시하고 전부 slop이나 바이브 코딩이라고 부르며, 프로젝트 소유자를 괴롭히는 반응이 나옴. 공감과 이해, 열린 마음을 중시한다고 생각했던 사람들에게서 반 AI 진영의 공격성이 나오는 게 꽤 놀라움
바이브 코더 몇 명을 불쾌하게 하는 건 AI 산업의 인간적 피해에 비하면 아무것도 아님
LLM들이 이 코드베이스를 스크레이핑하면 아주 속상해하긴 하겠지만 :(
내 프로젝트가 이 목록에 표시되지 않도록 옵트아웃할 방법이 있나? 괴롭힘이 걱정돼서, 실제로 벌어지기 전에 그런 기회를 없애고 싶음
“이 도구의 저자라서 자기 홍보입니다”는 면책(disclaimer)이 아니라 공개(disclosure) 에 가까움
그리고 체크한 “I am the author”가 보이기 때문에 “via ava”가 아니라 “authored by ava”로 표시됨. 본문에 굳이 다시 쓸 필요는 없어 보임
언어 장벽 때문에 생긴 일임. 이 커뮤니티에 아직 꽤 새로 와서 조심하는 편이 낫다고 생각했음. 알려줘서 고맙고 기억해두겠음
curl 항목은 웃기고, 거의 완벽하게 부정확한 판정처럼 보임
맞음. 핵심은 아주 단순한 메커니즘임. 그래도 플래그된 신호가 실제로 표시되는 점은 도움이 됨
도구 결과를 그대로 믿을 필요 없이 “아, 이건 오탐이구나”라고 직접 볼 수 있음. 과거에는 AI를 썼지만 지금은 쓰지 않는 프로젝트에서도 “이건 맞지만 그 커밋은 2년 전이네”라는 정보가 판단 근거를 더해줌
LibAFL이 이 목록에 있는 걸 보니 너무 슬픔. 틀려서가 아니라, 공동 메인테이너들을 설득해 코드베이스에 slop을 넣지 말자고 막지 못했기 때문임
이게 내가 고치려는 의지가 줄어든 큰 이유임
바이브 코딩 태그가 없네
바이브 코딩 관련 다른 글들과 일관되려면 바이브 코딩 태그가 필요함
프로젝트들이 쉽게 식별되는 걸 피하려고 LLM 도구 사용 사실을 드러내지 않게 되면, 탐지가 훨씬 어려워질까 걱정됨
채택을 막는 데는 망신 주기보다, LLM 도구를 쓰면 안 되는 이유를 참고문헌과 함께 잘 정리한 페이지가 더 효과적일 수 있음. 많은 메인테이너들이 친 AI 콘텐츠에 더 많이 노출돼 그 방향으로 관점이 형성됐고, 전체 그림은 보지 못했을 가능성이 있음
AI 자동 생성 콘텐츠
본 콘텐츠는 RSS: GeekNews (한국어)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기