
AI의 10만 가지 이유
요약
LLM이 생성하는 텍스트와 이미지의 통계적 유사성으로 인해 발생하는 'AI 슬롭(AI slop)' 현상을 분석합니다. 동일한 프롬프트에 대해 모델들이 유사한 패턴과 습성을 반복하며 인간의 창의적 결과물과 구분이 어려워지는 문제를 다룹니다.
핵심 포인트
- LLM은 통계적 모델로서 유사한 프롬프트에 대해 기능적으로 동일한 출력을 생성함
- AI 생성 콘텐츠의 반복적인 패턴(디자인, 주제 등)은 'AI 슬롭'의 특징임
- 콘텐츠 생성 비용이 소비 비용보다 낮아짐에 따라 콘텐츠의 질적 저하 우려
AI의 10만 가지 이유
동료 기술 전문가들과 제가 계속해서 벌이는 가장 고통스러운 논쟁 중 하나는, 사람이 작성한 텍스트와 AI가 생성한 텍스트를 구분할 수 있느냐는 문제입니다.
그들의 회의론은 합리적인 근거에 기반하고 있습니다. 본질적으로 LLM (Large Language Models)은 인간이 말하는 방식에 대한 최첨단 통계 모델이기 때문입니다. 만약 그렇다면, 모델의 출력물은 거의 정의상 어떤 통계적 테스트 하에서도 인간의 언어와 구별할 수 없어야 합니다.
저는 이것이 항상 선의를 가지고 논의되는 것은 아니라고 생각합니다. 적어도 일부 논쟁은 기술을 부정직하게 사용하는 것에 대해 부인할 수 있는 여지를 남기려는 사람들에 의해 시작됩니다. 하지만 당신이 진심으로 이 믿음을 가지고 있다면, 다음과 같은 콜라주를 제시하겠습니다.
[IMG:1]
이 이미지는 Amazon 사이트에서 “100000 whys”를 검색했을 때 나타나는 약 150개의 Amazon 도서 표지를 보여줍니다 (링크). 이 책들 중 일부는 아동 문학 분야의 카테고리 베스트셀러입니다. 확대 가능한 전체 해상도 버전은 여기서 볼 수 있습니다.
이 제목들이나 표지 중 그 어떤 것도 비인간적이지는 않습니다. 동시에, 당신이 현재 Amazon의 많은 비소설(nonfiction) 도서 카테고리를 채우고 있는 가장 순수한 형태의 AI 슬롭 (AI slop)을 마주하고 있다는 사실을 굳이 설득할 필요도 없을 것입니다. 더 구체적으로, 우리가 여기서 보고 있는 것은 도구들이 준결정론적 (quasi-deterministic)이라는 것의 결과물입니다. 만약 백 명의 “저자”가 자신이 가장 좋아하는 AI 도구에 유사한 프롬프트(prompt)를 준다면 — 예를 들어, “어린이를 위한 참고서를 생성해줘” 라고 한다면 — 모델은 아마도 80%의 확률로 기능적으로 동일한 출력을 생성할 것입니다.
콜라주에 나타난 유사성은 제목의 선택을 훨씬 뛰어넘습니다. 예를 들어, 맨 윗줄의 모든 표지는 디자인의 왼쪽 상단에 포효하는 공룡을 특징으로 합니다. 데이터에는 다른 많은 클러스터(cluster)도 존재합니다. 반복적으로 등장하는 빨간색과 흰색의 만화 로켓, 골든 리트리버, 사자 등을 찾아보십시오.
이것이 바로 LLM의 글쓰기를 독특하게 만드는 지점입니다. 모델의 개별적인 습성(mannerisms)이 인간과 다르기 때문이 아닙니다. 거의 모든 일반적인 프롬프트(prompt)에 반응하여 모델들이 동일하고 복잡한 일련의 습성들에 의존한다는 점이 핵심입니다. 이는 모호한 신호(fuzzy signal)이므로, 인턴이 *“이게 아니라 저거예요”*라고 말한다고 해서 바로 해고해서는 안 됩니다. 하지만 더 캐주얼한 상황이라면, 당신의 직감을 믿어도 좋습니다. 사실, 온라인 상호작용의 전통적인 모델들은 콘텐츠를 소비하는 것보다 생성하는 데 훨씬 적은 노력이 들게 될 경우 무너지기 때문에, 이러한 직관은 점점 더 중요해지고 있습니다.
추신: 만약 블로그 작성을 자동화하기 위해 LLM을 사용하고 있다면: 네, 기술은 놀랍습니다. 하지만 아마도 당신의 출판물 이름은 “10만 가지 이유(100,000 Whys)”로 개명되어야 할지도 모릅니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 HN AI Posts의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기