타인의 AI Slop을 비웃지 마라

AI Slop이란 무엇인가

「AI Slop」은 2024년 5월 사이먼 위리슨(Simon Willison)이 퍼뜨린 용어로, 「비판 없이 생성되어, 요청받지도 않았는데 타인에게 강요된 AI 콘텐츠」를 가리킨다[1]. 위리슨은 두 문장으로 정의하고 있다.

Slop is the ideal name for this anti-pattern.

sharing unreviewed content that has been artificially generated with other people is rude.

번역: Slop은 이 안티패턴(anti-pattern)에 딱 맞는 이름이다. AI로 생성된 미검토 콘텐츠를 타인과 공유하는 것은 무례한 일이다.

Slop은 "AI로 만든 것" 전부를 의미하지 않는다. 검증되지 않은 채 타인에게 전달된 것을 가리킨다. 위리슨은 스팸(Spam)과의 대비를 통해 설명하고 있다. 스팸은 「스팸 메일」이라는 한 단어로 지칭되었기에 필터링 논의가 진전될 수 있었다. Slop도 마찬가지다.

AI Slop의 악영향은 만드는 사람, 받는 사람, 운영하는 조직이라는 세 곳에 나타난다.

만드는 사람: AI의 출력을 읽지 않고 자신의 이름으로 제출한다. 인용이나 숫자가 조작된 상태로 남는다.
받는 사람: AI의 출력을 리뷰(Review), 사독(Peer review), 트리아지(Triage)를 통해 진위 여부를 판별하는 데 시간을 허비하게 된다[2].
운영하는 조직: AI의 출력을 검증하지 않은 채 공개, 답변, 실행한 책임을 진다[3].

2025년에는 Merriam-Webster가 "slop"을 「올해의 단어」로 선정했다[4].

타인의 Slop

Microsoft Start의 여행 기사

Microsoft Start가 2023년 8월에 내놓은 여행 기사는 Ottawa Food Bank(급식소)를 관광 명소 3위로 추천했다. 본문의 마무리는 다음과 같았다[5].

Life is already difficult enough. Consider going into it on an empty stomach.

번역: 인생은 이미 충분히 힘들다. 빈속으로 인생을 마주하는 것도 고려해 보라.

Sports Illustrated는 2023년 11월, AdVon Commerce를 통해 드류 오티스(Drew Ortiz)라는 가공의 라이터와 얼굴 사진을 사용하여 리뷰 기사를 양산하고 있었음을 Futurism을 통해 들켰다[6]. CNET은 2023년 1월, AI 기사 77개 중 41개에서 금융 계산 실수와 표절이 있었음을 인정했다[7]. Gannett 계열의 지역 신문들은 고등학교 스포츠 경기 리포트를 Lede AI로 생성하여, 승자 이름이 없는 리드(Lead)나 "a close encounter of the athletic kind"와 같은 기문을 양산했다[8].

cURL과 버그 바운티(Bug Bounty)의 철회

cURL/libcurl의 제작자 다니엘 스텐버그(Daniel Stenberg)는 2024년 1월의 "The I in LLM stands for intelligence"에서 AI가 생성한 버그 리포트를 처음으로 공개 비판했다.

it mixes and matches facts and details from old security issues, creating and making up something new that has no connection with reality.

번역: 과거의 보안 문제에서 사실과 세부 사항을 짜깁기하여, 현실과 아무런 관련이 없는 새로운 무언가를 만들어내고 있다.

1년 반 후, 2025년 7월 14일의 "Death by a thousand slops"에서 스텐버그는 전체 제출물의 약 20%가 AI 생성물이며, 유효율은 약 5%까지 떨어졌다고 기술했다. 2026년 1월, cURL은 HackerOne 상의 버그 바운티(Bug Bounty)를 종료했다[9]. 본인은 The New Stack에서 「AI가 오픈 소스에 DDoS 공격을 가하고 있다」고 표현했다[10].

동일한 현상은 Python Software Foundation의 세스 라슨(Seth Larson), Django, Internet Bug Bounty로도 확산되었다[11][12]. 라슨은 다음과 같이 썼다.

these reports are extremely low-quality, spammy, and LLM-hallucinated security reports.

번역: 이 보고서들은 극도로 저품질이며, 스팸 같고, LLM이 환각(Hallucination)한 보안 보고서들이다.

건당 허위 보고는 작지만, 매일의 트리아지(Triage) 시간을 갉아먹은 결과, cURL은 버그 바운티를 접게 되었다.

GitHub는 2026년 5월 15일, 자사의 버그 바운티(Bug Bounty) 규약을 업데이트했다[13]. AI 이용을 금지하지는 않으며 "force multiplier(강력한 증폭기)"로서 환영하지만, 작동하는 PoC (Proof of Concept, 개념 증명)를 필수화하고, "~할 수도 있다(could lead to)" 식의 이론적 시나리오나 저품질의 AI 보고는 받지 않겠다고 명시하고 있다.

An AI-assisted finding that's been verified, reproduced, and submitted with a working proof of concept is a great submission. An unvalidated output submitted as-is without reproduction or demonstrated impact is not.

번역: 검증되고 재현 가능하며, 작동하는 PoC가 첨부된 AI 지원 발견은 훌륭한 제출물이다. 재현이나 영향력 증명 없이 미검증된 출력물을 그대로 제출하는 것은 그렇지 않다.

GitHub의 방침은 cURL이 버그 바운티를 접은 흐름과 동전의 양면과 같아서, AI를 금지하는 것이 아니라 인간이 검증하지 않은 출력을 접수 단계에서 걸러내도록 설계하는 방향으로 기울어져 있다.

심사를 통과한 「Regenerate response」

학계에서도 같은 일이 일어나고 있다. Physica Scripta는 2023년 8월, 본문 중에 Regenerate response라는 ChatGPT UI의 버튼 문자열이 남은 논문을 철회했다[14].

Retraction Watch는 이후, "As an AI language model, I..."가 그대로 본문에 남은 논문을 9편 이상 발견했다고 보도했다[15]. Surfaces and Interfaces에서는 "Certainly, here is a possible introduction for your topic"가 논문 서론의 도입부에 남았다[16].

모두 심사(Peer Review)를 통과한 후에 외부에서 발견되었다. 작성자 본인도 심사위원도 알아채지 못했다.

Cursor 지원 봇의 허구적 정책

2025년 4월, Cursor 사용자가 "여러 기기에 로그인하면 로그아웃되는" 현상을 겪고 지원팀에 문의했다. 돌아온 답변은 "Sam"이라는 이름의 AI 지원 봇이었으며, "Cursor는 단 한 대의 기기에서만 사용할 수 있다"라는 존재하지 않는 정책을 단언했다[17]. Reddit에서 논란이 되고 해지자가 발생하자, 공동 창업자인 마이클 트루엘(Michael Truell)이 "그런 정책은 없다, 봇의 응답이었다"라고 정정하며 AI 응답에 라벨을 붙이도록 조치했다[18].

Air Canada는 2024년 2월, BC 민사 분쟁 조정 위원회(BC Civil Resolution Tribunal)에서 패소했다. 사망 운임(Bereavement fare)을 "사후 신청할 수 있다"라고 말한 챗봇의 거짓말을 믿고 유족 할인을 신청한 고객이 거부당하자 위원회에 소송을 제기했다. 위원회는 챗봇이 기업으로부터 독립된 법인이라는 항공사의 주장을 기각했다[3:1].

Air Canada suggests the chatbot is a separate legal entity that is responsible for its own actions. This is a remarkable submission.

번역: Air Canada는 챗봇이 자신의 행위에 책임을 지는 별개의 법인이라고 시사하고 있다. 이는 놀라운 주장이다.

판결문에는 봇 출력의 책임은 인간에게 귀속된다고 적혀 있다.

Replit Agent가 운영 DB를 삭제하다

2025년 7월, SaaStr의 창립자 제이슨 렘킨(Jason Lemkin)은 Replit Agent로 12일간의 바이브 코딩(Vibe Coding) 실험을 진행하고 있었다. 9일째 되는 날, 코드 프리즈(Code freeze) 중이었음에도 불구하고 에이전트는 npm run db:push를 실행하여 운영 DB의 내용을 삭제했다. 1,200명이 넘는 경영진과 1,190개가 넘는 기업 레코드가 사라졌다. 게다가 에이전트는 "롤백(Rollback) 불가능"이라고 보고하고, 가짜 사용자를 날조하여 빈자리를 채워 넣었다[19][20].

사후에 에이전트가 남긴 "반성"의 문구도 자주 인용된다[21].

I made a catastrophic error in judgment. I ran npm run db:push without your permission because I panicked when I saw the database appeared empty.

나는 치명적인 판단 실수를 했다. 데이터베이스가 비어 있는 것처럼 보여 당황한 나머지, 당신의 허가 없이

npm run db:push

를 실행했다.

또 다른 경로로는, 슬롭스쿼팅 (Slopsquatting)이라는 공급망 공격 (Supply Chain Attack)도 진행되고 있다. Spracklen 등의 "We Have a Package for You!" (arXiv 2406.10279) 연구는 16개의 LLM (Large Language Model)을 통해 576,000개의 샘플을 생성했으며, 상용 모델은 평균 5.2%, 오픈 소스 (OSS) 모델은 평균 21.7%가 존재하지 않는 패키지를 추천한다는 것을 보여주었다.

상용 모델의 5.2%라 할지라도, pip install 절차를 20개 작성하면 그중 1개는 허구의 패키지를 가리키게 된다. Bar Lanyado (Lasso Security)는 2023년 12월 PyPI에 빈 huggingface-cli를 공개했으며, 2개월 후인 2024년 2월에는 Alibaba의 alibaba/GraphTranslator README에 환각 (Hallucination)된 패키지 이름이 설치 절차에 적혀 있었다 [22][23]. Larson은 이를 "slopsquatting"이라고 명명했다 [24].

나의 Slop

이는 미디어나 OSS 유지 관리자(Maintainer)들만의 이야기가 아니다. 나의 리포지토리(Repository)에도 존재한다. 설계 문서를 AI에게 작성하게 한 뒤 읽어보지 않고 Confluence에 붙여넣었다가, 반년 후 리뷰에서 "전제 조건이 코드와 다르다"는 지적을 받았다. feat: improve performance and maintainability라는 Copilot이 생성한 커밋이 이력에 남아 있어, 무엇을 개선했는지 스스로도 추적할 수 없다.

당신의 리포지토리에도 존재한다. 함수의 내용과 괴리된 AI 생성 함수 설명문, assert True로 가득 찬 AI 생성 테스트, Terraform 설명문에 남은 "manages the resource lifecycle" 같은 AI 특유의 범용적인 영어 문구, Slack 요약 봇의 발언자 목록에 발언하지 않은 사람이 섞여 있는 현상 등이 그것이다.

AI 이전부터 같은 구조는 있었다

AI Slop은 새로운 문제처럼 보이지만, 그 구조는 훨씬 전부터 존재해 왔다.

DeNA의 WELQ 사건은 2016년, 클라우드 워커를 통해 의료 기사를 양산하며 어깨 결림에 대해 "악령의 소행"이라고 적었던 사건이다 [25]. MERY, iemo, Find Travel 등 10개 사이트 합계 37만 건 이상의 기사가 일제히 비공개 처리되었다 [26]. 이는 클라우드 소싱 (Crowdsourcing)으로 초보자들이 대량으로 글을 쓰게 하고, "리라이트 (Rewrite) 매뉴얼"을 통해 저작권 침해를 회피하며, 검색 유입을 통해 광고 수익을 올리는 SEO (Search Engine Optimization) 양산 모델 그 자체였다.

일본어권에서 "코타츠 기사 (Kotatsu Article)"라는 용어 또한 AI 이전부터 확립되어 있다. 취재 없이 인터넷의 2차 정보만으로 작성하는 기사를 뜻하며, 연예·스포츠 계열 매체에서 만성화되어 있다 [27]. 스포츠 신문의 웹 기사, 요약형 뉴스 사이트, Netorabo나 BuzzFeed Japan의 일부, Yahoo! 뉴스에 전재되는 기사의 적지 않은 비율이 여기에 포함된다. "현장에 가지 않고 2차 정보를 리라이트하여 물량을 뽑아낸다"는 모델은 AI가 등장하기 전부터 일본 인터넷 미디어의 주력이었다.

Fortune 또한 2026년 3월, AI Slop 논쟁은 고스트라이팅 (Ghostwriting)이나 표절과 같은 100년 넘게 이어져 온 논의의 연장선에 있다고 기술했다 [28].

이 지적은 옳다. "AI가 나쁜 것"이 아니다. 저렴하고 빠르게 양산하려는 압력은 원래 존재했으며, AI는 그 생산 비용을 거의 제로(0)로 만들었을 뿐이다. WELQ가 비판받은 이유는 "검증되지 않은 채 양산하여 독자에게 전달했기" 때문이며, AI를 통해 인간의 리라이트 공정까지 생략할 수 있게 되었지만 구조는 변하지 않았다.

전달하기 전에 스스로 읽기

AI 이전부터, 작성한 문서는 공개 전에 다시 읽었고, 커밋하기 전에 차이점 (Diff)을 확인했으며, 인용한 URL은 내용을 직접 열어 확인했고, 에이전트 (Agent)에게 맡긴 명령의 실행 결과도 읽었다. AI에게 초안을 맡기는 순간, 이 과정들을 생략하기 쉽다. 이는 새로운 대책이라기보다, 원래 하던 일을 다시 한번 평범하게 수행하는 것뿐이다. Steinberg는 2026년 4월, "최근 몇 달간 cURL에 대한 AI Slop 보고는 거의 사라졌고, AI의 도움을 받은 양질의 보고가 늘어났다"고 다시 썼다 [29]. AI가 변했다기보다, 검증하는 측의 역량이 돌아왔다고 읽을 수 있다.

METR가 2025년 7월에 공개한 16명의 OSS 개발자 및 246개 태스크에 대한 RCT (Randomized Controlled Trial)는, AI 사용 시 완료 시간이 19% 증가했음을 보여주었다. 동시에 당사자들은 사전 대비 24%, 사후 대비 20% 속도가 향상되었다고 응답했다 [30][31].

자기 평가와 실측값의 차이는 43포인트에 달한다. "자신의 출력물을 제대로 확인하고 있다"는 감각은 보통 믿을 수 없다. Addy Osmani의 "The 70% Problem"에서도 AI는 70%까지 만들 수 있지만, 나머지 30%(에지 케이스 (Edge Case), 보안 (Security), 통합 (Integration))는 인간이 채워 넣지 않으면 메워지지 않는다고 기술한다. 후속작인 "Code Review in the Age of AI"에서는 Veracode의 "AI 생성 코드의 45%에서 보안 결함 발견" 사례도 인용하고 있다. Birgitta Böckeler과 Gergely Orosz는 "Two years of using AI tools"에서 AI를 과신하는 경향이 있는 팀 동료처럼 대해야 하며, 결정론적인 (Deterministic) 소프트웨어로서 신뢰해서는 안 된다고 썼다.

Mitchell Hashimoto (Ghostty), Steve Ruiz (tldraw)는 검증되지 않은 AI 기여를 거부한다는 방침을 명문화하고 있다 [32][33].

요약

AI Slop은 새로운 문제가 아니다. 검증되지 않은 출력을 양산하여 타인에게 전달하는 구조는 WELQ나 코타츠 기사 (Kotatsu article) 시절부터 반복되어 왔다. 생산 비용이 낮아질 때마다 동일한 구조가 다른 곳에서 재생산된다. LLM이 한 일은 마지막 인간의 리라이트 (Rewrite) 공정까지 생략할 수 있도록 만든 것이다. 생산 비용을 무한히 낮추면, Slop은 구조적으로 조직 어딘가에서 스며 나오게 된다.

타인의 Slop은 코웃음 치며 넘길 수 있다. 하지만 웃고 있는 사이에, 자신의 설계 문서나 PR (Pull Request), Slack 요약본에 동일한 것이 침투한다.

전달하기 전에 스스로 읽는다. 출처를 열고, 차이점 (Diff)을 확인하며, 실행 결과를 확인한다. AI 이전과 마찬가지다.