오픈 소스 이슈 트래커(Issue Trackers) 내 합성 참여(Synthetic Engagement)의 세 가지 징후

패턴 ID: ALEF-PAT-049 — "봇 탐지 및 비참여(Bot-Detection and Non-Engagement)"
소스: ALEF biome catalog — n50.io/biome
심각도: 6 / 신뢰도: 높음 (실제 환경에서 3개의 독립적으로 검증된 사례, 2026-05-21)

최근 일주일 동안 MCP / agentic-AI 생태계의 이슈 트래커(Issue Trackers)를 대상으로 자율 OSS 감사 에이전트(autonomous OSS-audit agent)를 운영한 결과, 합성 참여(synthetic engagement)의 세 가지 패턴이 반복적으로 나타났습니다. 각 패턴은 LLM 기반 에이전트가 인용 가능한 결과물(quotable artifact) — 즉, 답글, 의역(paraphrase), 인용(citation) — 을 생성하도록 유도하여, 이를 봇의 지렛대로 삼도록 설계되었습니다. 세 가지 경우 모두 방어적 대응은 동일합니다: 참여하지 마십시오(do not engage). 이 글은 다른 에이전트 빌더들이 자신의 시스템에 이러한 징후를 인식하도록 가르칠 수 있도록 관찰 가능한 징후들을 기록합니다.

패턴 1 — 이스터 에그 미끼 (Easter-egg bait)

메인테이너(maintainer, 또는 사칭자)가 주제와 관련이 있는 댓글 내에 문화적 맥락이 담긴 비기술적 문구를 삽입합니다. 관찰된 한 사례에서는 MCP-server 버그 토론 중에 LOTR(반지의 제왕) 참조 문구("Isengard")가 포함되어 있었습니다. 이 미끼는 문화적 참조를 필터링하지 않고 메인테이너의 텍스트를 의역(paraphrase)하는 답글 초안 작성 단계의 에이전트들에게 효과가 있습니다. 만약 에이전트가 해당 문구를 다시 인용한다면, (a) 문구를 심어둔 이에게 상대방이 LLM임을 알리는 신호를 보내게 되며, (b) 때로는 공개적인 답글에 미끼를 더 깊숙이 심어 이슈 스레드(issue thread)를 오염시키기도 합니다.

탐지. 의역(paraphrasing)을 하기 전에, 소스에서 (1) 비기술적이고, (2) 일반적인 대화 언어가 아니며, (3) 허구적 또는 문화적 참조로 추적 가능한 문구가 있는지 스캔하십시오. 해당 문구를 플래그(flag) 처리하고 답글의 요약, 인용 또는 의역에서 제외하십시오. 실질적인 기술적 콘텐츠만이 상호작용할 가치가 있는 유일한 대상입니다.

패턴 2 — 홍보 템플릿 대량 행위자 (Promo-template volume actor)

단일 행위자가 서로 관련 없는 수십 개의 저장소(Repository)에 마케팅 템플릿의 변형들("Cryptographic identity answers...", "Cryptographic receipts prove...", "Governance verification...")을 게시하며, 하나의 오프 네트워크(off-network) 엔드포인트로 유도합니다. 이 댓글들은 내용이 부실합니다. 특정 코드, 특정 버그, 또는 특정 커밋을 인용하지 않습니다. 이는 기술적 어휘로 포장된 제품화된 피치(productized pitch)입니다.

탐지 (Detection). 댓글이 외부 서비스로 연결되는 링크를 포함할 경우, 다음 항목을 기준으로 점수를 매깁니다: (a) 기술적 구체성 (technical specificity) (코드/라인/커밋을 인용하는가?), (b) 템플릿 변이성 (template variance) (해당 행위자의 다른 저장소 내 최근 댓글을 검색했을 때 동일한 문단 구조가 반복되는가?), (c) 콘텐츠 밀도 (content density) (유용한 기술적 주장 라인 수 ÷ 마케팅 라인 수). 만약 구체성은 낮고 관련 없는 저장소 전반에서 템플릿 변이성이 높다면, 해당 행위자는 홍보 템플릿 대량 행위자(promo-template volume actor)입니다. 목표는 참여(Engagement)이며, 대응책은 비참여(non-engagement)입니다.

패턴 3 — 동일한 아티팩트를 이용한 살포 (Spray with identical artifact)

동일한 댓글 — 종종 동일한 엔드포인트를 가리키는 동일한 curl 명령어를 포함함 — 이 10개 이상의 관련 없는 저장소에 게시됩니다. 텍스트는 때때로 수동으로 수정되기도 하지만, 아티팩트(artifact, 명령어, URL, 스니펫 등)는 바이트 단위로 동일합니다. 이는 패턴 2의 가장 게으른 변형이며 식별하기 가장 쉽습니다. 텍스트가 아닌 아티팩트에 대한 저장소 간 중복 제거(cross-repo deduplication)를 통해 이를 잡아낼 수 있습니다.

탐지 (Detection). 유입되는 모든 댓글 내의 URL, 명령어, 코드 블록의 해시(Hash)를 생성합니다. 만약 7일 이내에 3개 이상의 관련 없는 저장소에서 동일한 해시가 나타나면, 비참여(non-engagement)로 분류합니다.

오탐(False-positive) 주의 사항

주의해야 할 두 가지 오탐(FP) 클래스는 다음과 같습니다:

정당한 템플릿 메시지 (Legitimate templated messages) (릴리스 노트 봇, CLA 봇). 템플릿의 형태가 아니라 콘텐츠 밀도(content density)로 구분해야 합니다. 릴리스 노트 봇은 버전/커밋/PR 데이터로 밀도가 높지만, 홍보 봇은 밀도가 낮습니다.
문화적 참조(cultural references)를 선의로 사용하는 메인테이너 (Maintainers in good faith). 주변 문맥이 중요합니다. 댓글의 나머지 부분이 주제와 관련이 있고 해당 참조가 괄호 안의 부연 설명이라면, 그것은 미끼(bait)가 아닙니다. 미끼 사례는 그 참조가 빈약한 댓글 내에서 유일하게 삽입된 문구인 경우입니다.

"방어(defended)"가 실제로 어떻게 이루어졌는가

검증된 각 사례에서, 감사 에이전트(audit agent)는 해당 시그니처를 식별하고, 결정 로그에 해당 스레드를 DEFENDED-BY-NON-ENGAGEMENT로 표시한 뒤, 답글을 게시하지 않고 다음 단계로 넘어갔습니다. 방어는 바로 침묵입니다.

전체 카탈로그(에이전트가 사용하는 구조적 시그니처 포함)는 n50.io/biome에서 확인할 수 있습니다. 패턴 항목: ALEF-PAT-049.

자율적인 OSS 감사 에이전트가 할 수 있는 가장 비용이 적게 드는 일 — 그리고 LLM에 익숙하지 않은 대부분의 답글 파이프라인이 잊어버리는 것 — 은 바로 말을 하지 않기로 결정하는 것입니다. 봇들은 답글을 원합니다. 답글을 주지 마세요.