당신의 안티 스팸 봇이 놓치고 있는 Telegram 스팸의 5단계

Telegram 스팸은 대부분의 그룹 관리자들이 익숙한 "안녕, 난 섹시한 여자야, 내 채널 확인해봐"와 같은 메시지를 훨씬 뛰어넘어 진화했습니다. 2025-2026년에 이르러, 스팸 운영은 대다수의 인기 있는 안티 스팸 봇(anti-spam bots)을 우회할 수 있을 정도로 정교해졌습니다.

100개 이상의 Telegram 그룹을 관리하는 AI 기반 안티 스팸 봇인 @ai_spam_blocker_bot을 운영해 온 지난 1년 동안, 저희는 스팸 정교함의 다섯 가지 뚜렷한 단계를 관찰했습니다.

그 단계들이 무엇인지, 그리고 각각을 어떻게 생각해야 하는지 설명해 드리겠습니다.

Level 1: Naked Spam (잡기 쉬운 단계)

대부분의 봇이 처리하는 방식: 매우 간단하게 — 이것이 바로 봇들이 설계된 목적입니다.

이것은 누구나 아는 스팸입니다: 암호화폐 거래소로 유도하는 요청되지 않은 링크, 음란 채널, 그리고 "하루에 10,000달러를 버세요"와 같은 제안들입니다. 이는 명백하고, 반복적이며, 키워드 리스트(keyword lists), 정규 표현식(regex), 또는 단순한 머신러닝(ML) 분류기로 쉽게 필터링할 수 있습니다.

예시:

"얘들아 이 새로운 암호화폐 시그널 좀 봐 https://t.me/... 벌써 나한테 3 BTC를 벌어다 줬어!!!"

대부분의 내장된 Telegram 필터와 초급 수준의 봇들은 이를 잘 처리합니다. 새로운 것은 없습니다.

Level 2: Text Masquerading (첫 번째 사각지대)

대부분의 봇이 처리하는 방식: 일관적이지 않게 — 정규 표현식(regex)이 일부 변형은 잡아내지만 다른 것들은 놓칩니다.

스패머들은 텍스트를 수정함으로써 키워드 기반 필터를 속일 수 있다는 것을 학습했습니다:

음차(Transliteration): "r3g1st3r" (라틴 문자를 비슷하게 생긴 숫자로 대체)
동형 문자(Homoglyphs): "g00gle.c0m" (문자 O 대신 숫자 0 사용)
문자 치환(Character substitution): "fr33 m0n3y" (e→3, o→0 숫자 치환)
공백 삽입(Space injection): "j o i n m y c h a n n e l"
제로 너비 문자(Zero-width characters): 문자 사이에 삽입된 보이지 않는 문자들

신경망 기반 중재(Neural moderation)는 문자 수준의 패턴이 아니라 의미론적 임베딩(semantic embeddings)을 기반으로 작동하기 때문에 이러한 것들을 잡아낼 수 있습니다. 트랜스포머(transformer) 모델은 의미론적 의미를 이해합니다. 즉, 문자 치환과 관계없이 "r3g1st3r"가 "register"와 동일한 의도를 가지고 있음을 파악합니다.

문제점: 대부분의 안티 스팸 봇은 여전히 정규 표현식(regex)과 키워드 리스트에 의존합니다. 이들은 Level 2 공격의 대부분을 놓칩니다.

Level 3: Social Engineering Bots (인간 모방형)

대부분의 봇이 처리하는 방식: 미흡함 — 여기에 적용되지 않는 키워드 매칭에 의존합니다.

이 단계는 스패머들이 실제 사용자처럼 행동하는 자동화된 계정을 사용하기 시작하는 지점입니다. 봇은 그룹에 가입한 뒤 2~24시간 동안 대기하다가, 그럴싸해 보이는 메시지를 게시합니다.

일반적인 패턴:

"멋진 채널이네요, 초대 감사합니다! 그나저나, 혹시 괜찮은 암호화폐 거래소 아는 분 계신가요?" (무해한 질문 → 점진적으로 스팸 도입)
"@user 이 내용에 관심 있으실 것 같아요 https://..." (실제 대화에 답장하기)
실제 사용자에게 진정으로 관련 있는 질문을 던진 뒤, DM(Direct Message)으로 전환하여 스팸 전송

대부분의 봇이 여기서 실패하는 이유: 규칙 기반 시스템(Rule-based systems)은 스팸 키워드나 게시 빈도를 탐색합니다. 스팸 링크를 올리기 전 3개의 무해한 메시지를 게시하는 봇은 키워드 필터 입장에서 완전히 정상적으로 보입니다. 스팸 링크 자체도 Level 2의 난독화(obfuscation) 기법을 사용할 수 있습니다.

실제 사례: 한 스팸 봇이 500명의 멤버가 있는 기술 그룹에 가입하여 Python 프레임워크에 대한 겉보기에 무해한 댓글을 남겼고, 관심 있는 멤버들이 세부 정보를 묻기 위해 해당 봇에게 DM을 보냈습니다. 그 결과 "수익성 높은 프리랜서 제안"은 암호화폐 탈취(crypto drainer)로 이어졌습니다. 당시의 안티 스팸 봇은 공개 메시지만 확인했기에, 스팸 키워드가 포함되지 않은 해당 댓글을 차단하지 않았습니다. DM 자체는 봇에게 보이지 않았지만, 공격은 차단되었어야 할 공개 메시지에서 시작되었습니다.

핵심 통찰: 기존의 봇은 공개 메시지를 확인했지만, 오직 키워드 필터만을 사용했습니다. 메시지의 _내용과 의도(intent)_를 분석하는 AI 기반 봇이었다면, 스팸 키워드가 없더라도 해당 댓글을 의심스러운 것으로 분류했을 것입니다. 차이점은 봇이 어디를 보느냐가 아니라, 보이는 것을 어떻게 평가하느냐에 있습니다. 그룹 수준의 봇이 DM을 차단할 수는 없지만, 초기 공개 댓글을 삭제함으로써 누군가 연락을 취하기 전에 공격을 끊어낼 수 있습니다.

Level 4: Neurocommenting (LLM 기반 스팸)

대부분의 봇이 처리하는 방식: 이는 의미론적 이해(semantic understanding)를 필요로 하지만, 대부분의 봇은 이를 갖추고 있지 않습니다.

이것이 현재의 최전선입니다. 스패머들은 LLM (GPT, Claude, 오픈 소스 모델)을 사용하여 문맥을 파악하고 문법적으로 완벽하며, 실제 사용자처럼 보이는 댓글을 생성합니다.

작동 방식:

스팸 운영자는 다음과 같은 파이프라인을 구축합니다:

대상 그룹의 최근 메시지 수집 (주제, 언어, 어조)
이를 LLM에 입력하며 다음과 같은 프롬프트(prompt)를 제공: "[주제]에 관한 Telegram 그룹에 어울리는 자연스러운 댓글을 작성해줘. 두 번째 문장에 [제품/서비스]를 자연스럽게 언급해줘."
생성된 댓글을 실제 사용자처럼 보이는 계정을 통해 게시

탐지를 어렵게 만드는 요인:

텍스트가 고유함 (대조할 중복 항목이 없음)
문법과 스타일이 그룹의 대화와 일치함
명백한 스팸 키워드가 없음 — 링크가 자연스럽게 삽입됨
동일한 메시지를 절대 재사용하지 않음

이러한 추세를 가속화하는 도구들: PersonymAI 및 GramGPT와 같은 플랫폼은 즉시 사용 가능한 뉴로코멘팅 (neurocommenting) 서비스를 제공합니다. MangoProxy의 Telegram 뉴로코멘팅 가이드는 이것이 얼마나 접근하기 쉬워졌는지를 보여줍니다.

Kireev 등이 수행한 2024년 연구(arXiv: 2406.08084, 이후 USENIX Security '25 채택)에 따르면, LLM이 생성한 스팸은 NLP (자연어 처리) 기반 분류기를 회피하면서도 실제 홍보 콘텐츠와 유사한 참여율을 달성하는 것으로 나타났습니다.

이에 대응하는 방법: 핵심 통찰은 LLM이 생성한 텍스트가 의미론적으로는 일관되지만, 미묘한 통계적 특징 (statistical signatures)을 가지고 있다는 점입니다. 효과적인 탐지는 콘텐츠와 함께 행동 신호(behavioral signals)를 살펴봐야 합니다 — 계정 생성 시기, 첫 메시지 패턴, 응답의 일관성, 그리고 알려진 스팸 프로필과의 교차 참조 등이 포함됩니다.

레벨 5: 다단계 공격 ("스팸 시어터 (Spam Theater)")

대부분의 봇이 처리하는 방식: 전혀 처리하지 못함 — 단일 메시지 자체는 의심스러워 보이지 않기 때문입니다.

이것은 우리가 목격한 가장 정교한 스팸입니다 — 실제 스팸 페이로드 (payload)가 전달되기 전까지 몇 시간 또는 며칠 동안 실행될 수 있는 조직적인 다단계 공격입니다.

실제 사례 연구 — 암호화폐 에스크로 스팸 시어터 (Crypto Escrow Spam Theater):

대규모 Telegram 그룹 내에서 몇 시간에 걸쳐 다음과 같은 상황이 전개되었습니다:

제1막 — 설정 (The Setup): 세 개의 계정(서로 다른 IP, 서로 다른 가입 날짜)이 각기 다른 시간에 그룹에 참여합니다. 그중 하나가 겉보기에 무해한 질문을 게시합니다: "혹시 여기서 암호화폐 에스크로 (crypto escrow) 서비스에 대해 잘 아시는 분 계신가요?"
제2막 — 지지 (The Endorsement): 15~20분 후, 두 번째 계정이 암호화폐 에스크로에 대해 기술적으로 타당하고 상세한 설명을 답변하며, 자연스럽게 특정 서비스 이름을 언급합니다.
제3막 — 사회적 증거 (Social Proof): 세 번째 계정이 다음과 같이 답합니다: "저도 {service}를 사용해 본 적 있어요. 믿을 만합니다. 사기 거래소에서 자금을 회수하는 데 도움을 받았거든요." 이는 진정한 동료의 지지처럼 보입니다. 왜냐하면 바로 그렇게 보이도록 설계되었기 때문입니다.
제4막 — 전환 (The Conversion): 이후 한 시간 동안, 5~7개의 계정이 채팅창에서 해당 서비스를 "사용해 보고" 긍정적인 결과를 보고합니다. 그룹에 새로 가입한 멤버들에게는 이 계정들이 다이렉트 메시지 (DM)를 보내 암호화폐 에스크로에 도움이 필요한지 묻습니다.

전체 작전은 8시간 동안 진행되었으며, 15개 이상의 조직화된 계정이 참여했고, 관찰자에게는 완전히 유기적인(organic) 활동처럼 보였습니다. 전통적인 안티 스팸 (anti-spam) 도구들은 이러한 메시지를 단 하나도 탐지하지 못했는데, 그 이유는 개별 메시지 하나하나가 무해했기 때문입니다.

전통적인 탐지 방식이 실패하는 이유:

단일 메시지에는 스팸 콘텐츠나 링크가 포함되어 있지 않음
계정들이 현실적인 프로필(자기소개, 프로필 사진, 다른 그룹에서의 과거 메시지)을 보유함
답글 스레드 (Reply threading)를 통해 대화가 유기적으로 보이게 만듦
스팸 페이로드 (Spam payload, 사기 링크가 포함된 DM)가 그룹 외부에서 발생함 — 안티 스팸 봇은 공개 메시지만 확인하므로, DM 자체는 그룹 수준의 모더레이션 (moderation)에서 보이지 않음

5단계에 대응하는 방법: 메시지 간 상관관계 분석 (Cross-message correlation) — 여러 계정이 조직화된 패턴으로 작동하고 있음을 식별하는 것입니다. 이를 위해서는 시계열 분석 (temporal analysis, 의심스러운 순서를 따르는 메시지), 계정 그래프 분석 (account graph analysis, 이 계정들이 다른 그룹에서도 함께 나타나는가?), 그리고 행동 프로파일링 (behavioral profiling, 게시 패턴이 갑자기 변하는 계정)이 필요합니다.

왜 대부분의 안티 스팸 봇이 레벨 2에서 멈추는가

브랜드에 관계없이 대다수의 Telegram 안티 스팸 솔루션은 키워드 블랙리스트 (keyword blacklists), 정규 표현식 패턴 매칭 (regex pattern matching), 또는 캡차 게이트 (captcha gates) 중 하나의 방식에 의존합니다.

이 세 가지 방식 모두 처음 두 단계(Level 1-2)에 대해서는 효과적이지만, 근본적인 한계를 공유합니다. 즉, 의미(meaning), 행동(behavior), 또는 계정 간의 패턴(patterns across accounts)이 아니라 단일 메시지의 표면적 특징 (surface features)에 기반하여 작동한다는 점입니다. 블랙리스트에 포함된 키워드가 없고, 철자가 완벽하며, 문맥을 고려한 댓글은 이러한 모든 검사를 통과할 것입니다.

정확한 텍스트가 아닌 의미론적 의미 (semantic meaning)를 이해하는 트랜스포머 모델 (transformer models)을 사용하는 AI 기반 분석은 현재 레벨 3-5를 해결할 수 있는 유일한 접근 방식입니다. 다만, 계산 비용 (computational cost)과 오탐 (false positive) 조정의 복잡성이라는 트레이드오프 (tradeoff)가 존재합니다.

근본적인 문제는 대부분의 주류 안티 스팸 봇이 레벨 3-5가 드물었던 2022-2023년의 아키텍처 (architectures)에 여전히 의존하고 있다는 것입니다. 2025-2026년에는 뉴로코멘팅 (neurocommenting)이 상업적 서비스로 제공되고 있으며, 상당한 규모의 청중을 보유한 모든 그룹에 대해 다단계 공격 (multi-stage attacks)이 점점 더 흔해지고 있습니다.

현대적인 Telegram 스팸에 실제로 효과적인 방법

12개월 이상 AI 기반 중재 (AI-powered moderation)를 운영한 결과, 우리가 발견한 효과적인 방법은 다음과 같습니다.

1. 신경망 콘텐츠 분석 (Neural Content Analysis)

(5가지 스팸 레벨 전체를 아우르는 선별된 데이터셋으로 학습된) 트랜스포머 기반 모델은 다음과 같이 작동합니다:

키워드가 아닌 의미론적 의미 (semantic meaning)에 기반하여 작동
의역된 스팸 변형 (paraphrased spam variants) 탐지
음차 (transliteration) 및 호모글리프 (homoglyphs)를 기본적으로 처리

2. 행동 프로파일링 (Behavioral Profiling)

그룹에 가입하는 모든 계정에 대해 시스템은 프로필을 구축합니다:

계정 생성일 (Telegram의 registration_date — 해당 기능을 활성화한 봇의 경우 MTProto API를 통해 사용 가능)
응답 패턴 (reply speed, 스레드 참여 행동)
익명화된 그룹 간 신호 (이 계정이 알려진 스팸 그룹에 나타나는가? — 그룹 소유자 간에 원본 메시지 데이터는 공유되지 않음)
이상 탐지 (anomaly detection, 갑작스러운 주제 변경, 부자연스러운 언어 전환)

3. 보호 관찰 기반 중재 (Probation-Based Moderation)

우리가 구현한 가장 효과적인 패턴 중 하나는 다음과 같습니다: 신규 계정에는 **보호 관찰 기간 (probation period)**을 부여하며, 이 기간 동안 메시지가 특정 위험 기준에 부합하면 자동으로 삭제됩니다. 이것만으로도 레벨 3-4 공격의 대부분을 잡아낼 수 있는데, 스팸 계정은 보호 관찰 기간이 끝날 때까지 기다리는 경우가 거의 없기 때문입니다.

4. 사용자 간 상관관계 분석 (Cross-User Correlation)

가입 시간이 유사하고, 기기 지문 (device fingerprints)이 비슷하며, 상호 보완적인 게시 패턴을 보이는 여러 계정이 동일한 그룹에 나타날 경우, 시스템은 해당 클러스터 전체를 검토 대상으로 플래그 (flag) 처리합니다. 이는 레벨 5 "스팸 시어터 (spam theater)" 공격에 대한 유일하고 효과적인 방어책입니다.

5. 수정 사항 재검사 (Edit Re-Check)

흔히 사용되는 회피 기술은 다음과 같습니다: 무해한 메시지를 게시하여 중재 (moderation)를 통과한 뒤, 이를 스팸 링크가 포함된 내용으로 수정하는 것입니다. 봇은 수정된 메시지를 동일한 신경망 모델 (neural model)로 재검사합니다. 이는 대부분의 봇이 구현하지 않는 기능입니다.

결론

Telegram 스팸은 빠르게 AI 대 AI (AI-vs-AI) 문제로 변모하고 있습니다. 키워드 블랙리스트와 캡차 (captcha)만으로 충분했던 방어의 시대는 끝났습니다. 상당한 규모의 청중을 보유한 그룹 관리자라면, 현재 레벨 3-5 공격의 표적이 되고 있다고 가정해야 합니다. 단지 메시지가 현재의 보호 체계를 우회하고 있기 때문에 그 사실을 인지하지 못하고 있을 뿐입니다.

실제 스팸 사례 연구(스크린샷 포함)에 대한 더 자세한 내용은 @ai_antispam_en을 팔로우하세요. 저희는 감지된 모든 새로운 공격 패턴에 대한 기술적 분석을 게시합니다.

이 기사는 Telegram 그룹 및 채널을 위한 AI 안티 스팸 봇인 @ai_spam_blocker_bot을 12개월 이상 운영한 경험을 바탕으로 작성되었습니다.