오해였던 부정행위 의혹: 인간의 창작물이 AI로 오해받을 때

한 학생이 에세이를 제출합니다. 구조가 잘 잡혀 있고, 문법적으로 결점이 없으며, 문체가 일관적입니다. 교사가 이를 AI 탐지기(AI detector)로 돌려봅니다. 탐지기는 다음과 같이 말합니다: AI 생성 확률 98%. 학생은 교장실로 불려갑니다. 그녀는 울음을 터뜨립니다. 자신이 직접 썼다고 맹세합니다. 그녀는 초안, 개요, 검색 기록을 보여줍니다. 교사는 회의적입니다. 탐지기는 절대 틀리지 않으니까요. 하지만 틀렸습니다. 학생은 진실을 말하고 있습니다. 그녀가 로봇처럼 글을 쓰는 이유는 로봇처럼 쓰는 법을 배웠기 때문입니다. 그리고 이제 그녀는 그 때문에 처벌을 받고 있습니다. 이것이 바로 '오해였던 부정행위 의혹'입니다. AI 탐지 소프트웨어의 부상은 새로운 유형의 학술적 희생자를 만들어냈습니다: 신경다양성(neurodivergent) 학생, ESL(English as a Second Language) 학생, 템플릿을 통해 글쓰기를 배운 학생들입니다. 그들의 인간적인 문체는 기계의 문체와 구별할 수 없게 되었습니다. 그리고 알고리즘은 그 차이를 구분하지 못합니다.

AI 탐지기의 사각지대
대부분의 AI 탐지기는 두 가지 변수를 측정하여 작동합니다: 당혹도(perplexity, 단어 선택이 얼마나 놀라운지)와 돌발성(burstiness, 문장 길이의 변동성)입니다.

문제점:
낮은 당혹도(Low Perplexity): 예측 가능한 단어 선택. 이는 학술적 글쓰기, 법률적 글쓰기, 그리고 "어려운 단어를 피하라"고 교육받은 학생들에게 흔히 나타납니다.
낮은 돌발성(Low Burstiness): 균일한 문장 길이. 이는 자폐 스펙트럼을 가진 학생, 리듬에 과도하게 집착하는 ADHD 학생, 그리고 교과서로 영어를 배운 학생들에게 흔히 나타납니다.

결과:
매우 유능하고 규칙을 잘 따르는 인간 필자는 AI와 똑같아 보입니다. 반면, 무질서하고 창의적이며 오류가 잦은 인간 필자는 인간처럼 보입니다. 탐지기는 성실한 사람을 처벌하고 혼란스러운 사람에게 보상을 주고 있습니다.

역발상적 관점: 탐지기가 틀린 것이 아니라, 기준이 틀린 것이다.
우리는 "기계 같은" 텍스트를 식별하기 위해 AI 탐지기를 만들었습니다. 하지만 우리는 지난 50년 동안 학생들에게 "기계 같은" 방식으로 글을 쓰도록 가르쳐 왔습니다. 5단락 에세이, 수동태, 경직된 주제문(thesis statement) — 이것들은 인간적인 것이 아닙니다. 그것들은 산업적입니다. AI 탐지기가 학생을 잘못 비난하고 있는 것이 아닙니다.

그것은 학생의 글에 인간적인 변동성 (human variation)이 부족하다는 점을 정확하게 식별하고 있는 것입니다. 학생은 부정행위자가 아닙니다. 그 학생은 로봇처럼 말하도록 가르치는 교육법 (pedagogy)의 피해자입니다.

가장 위험에 처한 네 가지 그룹

신경다양성 (Neurodivergent) 작가
특징: 반복적인 문장 구조, 문자 그대로의 단어 선택, 은유 (metaphor) 사용의 어려움.
탐지되는 이유: AI 또한 은유를 다루는 데 어려움을 겪으며, 문자 그대로의 반복적인 산문 (prose)을 쓰는 경향이 있습니다.

제2외국어로서의 영어 (ESL) 학생
특징: 흔한 구절에 대한 과도한 의존, 단순화된 어휘, 관용구 (idiom) 회피.
탐지되는 이유: AI 모델은 단순화된 영어로 학습됩니다. ESL 학생의 "안전한" 어휘는 AI의 "평균적인" 어휘와 크게 겹칩니다.

"템플릿"형 학생
특징: 엄격한 공식 (PEEL 단락 구성, Hamburger essay)을 사용하여 글을 씀. 균일한 문장 길이. 예측 가능한 전환어 ("In conclusion,", "Furthermore").
탐지되는 이유: 이러한 공식들은 AI가 논증을 구조화하도록 훈련받는 방식이기도 합니다.

완벽주의자
특징: 강박적인 편집, 모든 문장 파편 (sentence fragments)의 제거, 균일한 어조.
탐지되는 이유: AI는 오타를 내지 않습니다. 완벽한 에세이는 의심스럽습니다. 하지만 어떤 인간들은 그저 완벽주의자일 뿐입니다.

반론: 위양성 (False Positive)은 버그가 아니라 기능이다.
대학들은 AI 탐지기를 좋아합니다. 왜냐하면 그것이 주관적인 판단에 "과학적인" 겉치레를 제공하기 때문입니다. 탐지기가 "AI 확률 98%"라고 말하면, 교사는 자신의 판단이 정당하다고 느낍니다. 하지만 탐지기는 진실을 말하는 기계가 아닙니다. 그것은 패턴 매처 (pattern matcher)입니다. 그리고 그것이 매칭하는 패턴은 "위원회에서 작성한 것처럼 보이는 텍스트"입니다. 문제는 탐지기가 아닙니다. 문제는 우리가 한 세기 동안 학생들에게 위원회처럼 글을 쓰도록 훈련시켜 왔다는 점입니다.

사례 연구: 퇴학당한 자폐 스펙트럼 학생
캘리포니아의 한 대학교는 AI 탐지기 보고서를 근거로 한 학생에게 "학업 부정행위 (academic dishonesty)" 혐의를 씌워 퇴학 처분을 내렸습니다. 자폐 스펙트럼을 가진 이 학생은 초안 기록, Google Docs 버전 로그, 그리고 교수들의 인성 증언을 제출했습니다.

대학교는 결정을 유지했습니다. 법적 여파: 학생은 소송을 제기했습니다. 사건은 현재 진행 중입니다. 하지만 피해는 이미 발생했습니다. 학생은 한 학기를 날렸습니다. 대학교는 신뢰를 잃었습니다. 탐지기(Detector)는 아무런 타격도 입지 않았습니다. 교훈: AI 탐지기는 단독 증거로 인정될 수 없습니다. 하지만 소송을 제기할 자원을 가진 학생은 거의 없습니다. 대부분은 그저 0점 처리와 수치심을 감내할 뿐입니다.

자신을 방어하는 방법 (부당하게 의심받을 경우)

초안 기록 보존하기: 버전 기록(Version history) 기능이 활성화된 Google Docs나 Word에서 작성하세요. 인간의 글쓰기가 가진 지저분하고 파편화된 과정(삭제된 부분, 어색한 재구성, 오타 등)을 교수에게 보여주세요.

'변경 내용 추적(Track Changes)'을 종교처럼 철저히 사용하기: 만약 당신이 편집에 집착한다면, 그 편집 흔적을 보여주세요. AI는 깔끔한 최종 초안을 생성합니다. 인간은 시체 더미와 같은 흔적(Trail of corpses)을 남깁니다.

자신의 스타일을 선제적으로 공개하기: 학기 초에 교수에게 이렇게 말하세요. "저는 매우 구조적인 글쓰기를 합니다. AI가 쓴 것처럼 보일 수 있다는 점을 알고 있습니다. 제 에세이를 탐지기로 돌리기 전에 이 점을 유념해 주십시오."

재검토 요구하기: 의심을 받는다면, 단순히 소프트웨어 점수가 아닌 인간 패널(Human panel)을 요구하세요. 자신의 에세이를 동일한 주제로 생성된 실제 AI 에세이와 비교해 보세요. 차이점(사실 관계 오류, "환각 (Hallucinations)" 등)은 종종 눈에 보입니다.

교육자가 지금 해야 할 일

현재의 AI 탐지기 사용은 윤리적으로 파산 상태입니다. 이는 가장 많은 지원이 필요한 학생들을 처벌하고 있습니다.

새로운 프로토콜:
AI 탐지기를 주요 증거로 사용하는 것을 금지하기: 탐지기는 판결이 아닌, 인간의 검토를 위한 "플래그 (Flag)" 용도로만 사용하세요.
구술 방어(Oral Defense) 요구하기: 탐지기가 에세이를 지목한다면, 학생에게 구두로 설명하게 하세요. AI는 자신이 쓴 글에 대해 구술 방어를 즉흥적으로 해낼 수 없습니다.
교직원에게 AI 리터러시 (AI Literacy) 교육하기: 교수들은 "낮은 당혹도 (Low perplexity)"가 곧 "부정행위"를 의미하는 것은 아니라는 점을 이해해야 합니다.

장기적인 관점
우리는 과도기적 지옥에 있습니다. 과거의 규칙(완벽하게 쓰기)은 로봇 같은 작가 세대를 만들어냈습니다. 새로운 도구(AI 탐지기)는 그 로봇 같은 작가들이 우리가 훈련시킨 모습 그대로라는 이유로 그들을 처벌하고 있습니다. 해결책은 더 나은 탐지기가 아닙니다.

해결책은 "예측 가능하고 일관된 글쓰기"를 범죄로 취급하는 것을 멈추는 것입니다. 당신 자신의 글쓰기 스타일을 생각해 보세요. 당신은 짧고 균일한 문단으로 글을 쓰나요? 속어 (Slang)를 피하나요? 문장 파편 (Sentence fragments)을 싫어하나요? 만약 탐지기 (Detector)가 당신의 저작물을 스캔한다면, 그것은 당신을 인간으로 판단할까요, 아니면 기계로 판단할까요?

오해였던 부정행위 의혹: 인간의 창작물이 AI로 오해받을 때

요약

핵심 포인트

댓글