
연구진, 2010~2024년 사이 발표된 1,400만 편의 학술 논문 분석: ChatGPT가 영어를 재작성하고 있음을 발견
요약
연구진이 1,400만 편의 학술 논문을 분석한 결과, ChatGPT 출시 이후 특정 스타일 단어의 빈도가 급증하며 언어적 변화가 나타났음을 발견했습니다. 이는 AI가 학술적 글쓰기의 주제가 아닌 표현 방식(voice)을 변화시키고 있음을 시사합니다.
핵심 포인트
- ChatGPT 출시 후 'Delve', 'Intricate' 등 특정 스타일 단어 급증
- COVID-19 당시의 내용어 변화와 달리 현재는 문체(style)의 변화임
- 2024년 학술 논문의 최소 10%가 AI에 의해 편집/처리된 것으로 추정
- AI 모델이 전 세계적 언어 사용 방식에 동일한 지문을 남기고 있음
연구진은 2010년에서 2024년 사이에 발표된 1,400만 편의 학술 논문을 분석했습니다. 그들은 모든 단어를 추적했습니다. 그리고 ChatGPT가 영어를 재작성(rewriting)하고 있다는 사실을 발견했습니다.
비유적인 표현이 아닙니다. 말 그대로입니다.
2022년 11월 ChatGPT가 출시된 이후, 10년 넘게 학술적 글쓰기에서 안정적으로 유지되어 온 특정 단어들의 빈도가 갑자기 폭발적으로 증가했습니다. 튀빙겐 대학교(University of Tübingen)와 노스웨스턴 대학교(Northwestern University)의 연구진은 모든 초과 단어를 매핑하고 이를 분류했습니다.
이 단어들은 여러분이 이미 알고 있는 것들입니다.
"Delve(파고들다)." "Intricate(복잡한)." "Meticulous(꼼꼼한)." "Commendable(칭찬할 만한)." "Underscore(강조하다)." "Pivotal(중추적인)." "Nuanced(미묘한 차이가 있는)." "Landscape(풍경/지형)." "Comprehensive(포괄적인)." "Multifaceted(다각적인)." "Showcasing(보여주는)." "Groundbreaking(획기적인)." "Innovative(혁신적인)." "Invaluable(매우 귀중한)."
이전에는 없었던 329개의 초과 스타일 단어(style words)가 2024년 초에 나타났습니다. 이러한 급증은 해당 데이터셋의 역사상 전례 없는 일입니다.
이것이 지금까지 기록된 다른 모든 어휘 변화와 다른 점입니다. COVID(코로나19) 기간에도 초과 단어들이 나타났습니다. 2021년에는 최대 188개가 나타났습니다. 하지만 그것들은 내용어(content words)였습니다. "Respiratory(호흡의)." "Remdesivir(렘데시비르)." "Ventilator(인공호흡기)." 새로운 현실을 설명하는 단어들이었습니다.
ChatGPT 이후의 초과 단어들은 내용어가 아닙니다. 그것들은 스타일 단어(style words)입니다. 사람들이 무엇에 대해 쓰느냐가 아니라, 사람들이 어떻게 쓰느냐에 관한 것입니다. 주제(subject matter)는 변하지 않았습니다. 목소리(voice)가 변한 것입니다.
연구진은 2024년에 발표된 모든 학술 논문의 최소 10%가 ChatGPT로 처리되었다고 추정합니다. AI가 완전히 작성했다는 뜻이 아닙니다. 처리(processed)되었다는 것입니다. 편집(Edited)되고, 다듬어지고(Polished), 모델을 거쳐서 페이지에 여전히 그 지문(fingerprints)이 남아 있는 채로 출판되었다는 의미입니다.
여러분은 이 단어들을 어디에서나 보았습니다. 이메일에서, LinkedIn 게시물에서, 기사에서, 자기소개서에서, 그리고 동료가 보낸 보고서에서 말입니다. 왜 모든 것이 똑같이 들리기 시작했는지 설명할 수 없었을 것입니다. 이제는 설명할 수 있습니다. 인터넷 전체가 동일한 모델을 거쳤습니다. 그리고 그 모델은 자신이 접촉한 모든 것에 동일한 지문을 남겼습니다.
연구진은 또 다른 사실을 증명했습니다. 오염(Contamination)은 멈추지 않고 있습니다. 과잉 단어(excess words)의 수는 COVID 기간 동안 188개에서 ChatGPT 이후 329개로 증가했습니다. 곡선은 여전히 상승하고 있습니다.
ChatGPT는 우리가 언어로 할 수 있는 일을 단순히 변화시킨 것이 아닙니다. 언어 그 자체를 변화시켰습니다. 하나의 모델. 하나의 목소리. 1,400만 편의 논문. 그리고 전 세계적인 팬데믹보다 더 큰 어휘의 변화입니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 X @heynavtoor (자동 발견)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기