손으로 쓴 졸업 논문이 AI 99%로 판정될 때

대학이 지금도 학생에게 요구하는 느릿하고 성실한 방식으로 졸업 논문을 완성한 장면을 상상해 보길 바란다. 자료를 읽고, 구성을 짜고, 문장을 쓰고, 퇴고하고, 인용을 확인하며, 각 단락을 자신의 손으로 다듬는다. 그런데 판정 소프트웨어가 AI 99%라는 결과를 내놓는다. 학생은 빠져나가기 힘든 순환 속에 갇힌다. 저자성 (Authorship)을 나타내야 할 문장 하나하나가 의심의 재료가 된다. 수정할 때마다 새로운 점수가 나온다. 질문되는 내용은 학생이 무엇을 배웠는가에서, 블랙박스가 그 문체를 선호하는가로 옮겨가 버린다.

졸업 시기의 AI 판정 불안을 둘러싼 진정한 부조리는 바로 여기에 있다. 99%라는 수치는 과학적으로 보인다. 소프트웨어에서 나오기 때문에 최종 판단처럼 느껴진다. 하지만 그 수치는 많은 경우 문장의 규칙성, 어휘 분포, 예측 가능성, 기지의 생성 샘플과의 유사성 같은 통계적 신호에서 나오는 추정치다. 그러한 신호는 패턴을 보여줄 수는 있지만, 집필 과정을 복원할 수는 없다.

중요한 점은 단순하다. 판정 점수는 단서일 뿐이다. 단독으로는 약한 증거다. 처분의 결론으로 다룰 때 위험해진다.

학술적인 문장은 판정 소프트웨어가 의심스럽다고 보는 특징을 오히려 촉진하는 경우가 많다. 정중한 논문은 명확한 접속, 안정된 용어, 반복되는 정의, 신중한 주장, 분야에 결합된 좁은 어휘를 사용한다. 제2언어로 쓰는 학생은 더 안전한 문법과 규칙적인 문형을 선택하기 쉽다. 대학의 서식도 문체를 평탄하게 만든다. 선행 연구, 방법, 요약은 장르 그 자체가 일관성을 요구하기 때문에 매우 균질하게 들릴 수 있다.

연구는 이러한 시스템의 취약성을 이미 보여주고 있다. Stanford HAI는 7개의 판정기가 영어를 모국어로 하지 않는 작성자의 TOEFL 에세이 중 61.22%를 AI generated로 분류했으며, 적어도 하나의 판정기는 해당 에세이의 97%를 표시했다고 보고했다. Weber Wulff 등의 별도 연구는 널리 사용되는 판정 도구를 검증하여, 확신 있는 학술적 판단에 충분한 신뢰성을 갖지 못함을 보여주었다. Sadasivan 등의 논문 또한 바꾸어 쓰기 (Paraphrasing)에 의해 판정 성능이 떨어지며, 허위 신호가 평판 리스크를 만들 수 있음을 보여주었다.

이러한 지견이 모든 고발이 틀렸음을 의미하는 것은 아니다. 더 실무적인 결론을 준다. 학교는 확률 점수를 부정행위 사건으로 바꾸기 전에 신중해야 한다.

졸업생에게 AI 사용 의심은 학위 수여를 지연시키고, 취업 계획을 혼란에 빠뜨리며, 지도 교수와의 관계를 상처 입히고, 수년간의 노력을 퇴색시킨다. 입증의 부담은 조용히 학생에게 넘어간다. 학생은 초안, 입력 이력, 독서 메모, 집필 습관, 개인의 문체까지 설명해야 한다. 반면 대학은 수치를 제시하고 그것을 증거라고 부를 수 있다.

심리적인 영향도 크다. 학생은 독자를 위해서가 아니라 판정 소프트웨어를 위해 글을 쓰기 시작한다. 점수를 낮추기 위해 부자연스러운 변화를 넣는다. 명료한 문장이 위험해 보이기 때문에 일부러 약화시킨다. 라이팅 센터, 문법 지원, 번역 지원도 피하게 된다. 어떤 퇴고도 의심스럽게 보일 가능성이 있기 때문이다. 그런 환경에서 교육은 방어적인 연기로 변한다.

명확성이 중요한 분야에서는 특히 불공평하다. 의학 요약, 법률 메모, 실험 보고서, 공학 논문은 직접적이어야 한다. 직접성을 벌하는 것은 학생에게 잘못된 교훈을 준다.

대학에는 학술적 성실성 (Academic Integrity) 규칙이 필요하다. AI는 부정하게 사용될 수 있다. 논문 전체를 외부 도구에 맡기는 문제도 현실에 존재한다. 필요한 것은 저자성을 여러 증거로부터 살펴보는 절차다.

그 절차는 과제가 시작되기 전에 학생이 실제로 이해할 수 있는 명확한 AI 이용 방침을 제시하는 것부터 시작되어야 한다. 학생에게는 구성안, 노트, 초안, 출처 메모, 수정 이력을 저장하도록 권장할 필요가 있다. 제출물에 우려가 있을 때는 구두 설명이나 짧은 라이브 설명을 통해 학생이 자신의 작업을 이해하고 있는지 확인할 수 있다. 판정 결과는 많은 신호 중 하나로 취급해야 하며, 어떠한 처분 전에도 투명한 이의 신청 경로를 마련해야 한다.

이를 통해 논의는 문체 예측에서 학습의 증거로 옮겨간다. 어떤 출처가 왜 중요한지, 왜 단락을 바꿨는지, 왜 그 방법을 선택했는지, 결론의 한계는 무엇인지를 설명할 수 있는 학생은 그 어떤 백분율보다 강력한 증거를 보여주고 있다.

성숙한 대응은 학생을 현대적 도구로부터 격리하는 것이 아니라, 허용되는 AI 이용을 정의하는 것이다. 학생은 ChatGPT로 구성안을 점검하고, Gemini로 다른 설명을 비교하게 하며, Miss Formula로 수식 이미지를 편집 가능한 수식 표기로 바꾸어 노트를 정리할 수 있다. 논문에 AI generated 도표가 포함되는 경우, Editable Figure는 그것들을 편집 가능한 벡터 도표로 바꾸어 라벨, 화살표, 배치를 수정 이력과 함께 고칠 수 있게 한다.

학생이 주장을 펼치고, 출처를 확인하며, 추론에 책임을 지고, 작업 과정을 공개하고 있다면, 이러한 이용이 저자성 (authorship)을 없애지는 않는다. 현대의 진정한 학술적 기술은 도구를 피하는 것이 아니라 책임감 있는 도구 이용에 있다.

완전히 손으로 작성한 작업이 AI 99퍼센트라는 점수를 받았다면, 학교는 멈춰 서서 신중하게 확인해야 한다. 그 점수가 대화를 끝내서는 안 된다.

가장 공정한 기준은 과정, 이해, 책임의 증거이다. 학생이 초안을 보여주고, 선택을 설명하며, 작업 내용을 말할 수 있다면, 대학에는 평가해야 할 인간의 기록이 있다. 판정 소프트웨어가 그 기록과 상충한다면, 판정 소프트웨어 또한 검증되어야 한다.

AI 판정은 조기 경고로서 도움이 될 수 있다. 하지만 판단을 대체할 권위는 갖지 못한다. 졸업 심사는 학습을 측정하는 것이다. 불안해하는 학생과 불투명한 소프트웨어 간의 경쟁이 되어서는 안 된다.

손으로 쓴 졸업 논문이 AI 99%로 판정될 때

요약

핵심 포인트

댓글