교실 안의 AI: Berkeley에서의 낙제율 상승과 수학 능력 저하
요약
UC Berkeley의 컴퓨터 과학 학과에서 AI 코딩 어시스턴트의 무분별한 사용으로 인해 낙제율이 급증하고 수학적 추론 능력이 저하되는 현상이 보고되었습니다. AI 도구 사용 방식이 학생들의 기초 역량에 미치는 부정적 영향을 분석하고 책임감 있는 학습 프레임워크의 필요성을 강조합니다.
핵심 포인트
- Berkeley CS 핵심 과정에서 낙제 및 중도 포기율이 15~30% 급증
- AI 의존으로 인한 기초 수학 및 제1원리 추론 능력 저하 발생
- 문제는 AI 도구 자체가 아닌 비판적이지 않은 사용 방식에 있음
- 역량 저하를 막기 위한 구조화된 AI 지원 학습 프레임워크 필요
교실 안의 AI: Berkeley에서의 낙제율 상승과 수학 능력 저하
Meta Description: AI 사용과 함께 낙제율이 급증하고 Berkeley의 컴퓨터 과학 (CS) 수업에서 수학 능력이 저하되고 있습니다 — 데이터가 보여주는 현상과 학생들이 취할 수 있는 조치를 소개합니다. (158자)
요약 (TL;DR): UC Berkeley의 컴퓨터 과학 (Computer Science) 학과는 우려스러운 추세를 보고하고 있습니다. AI 코딩 어시스턴트 (AI coding assistants)가 도처에 깔리면서 낙제율은 상승하고 기초 수학 능력은 침식되고 있습니다. 이 기사는 현재 무슨 일이 일어나고 있는지, 이것이 Berkeley를 넘어 왜 중요한지, 그리고 무엇보다 중요한 점으로서 학생과 교육자가 핵심 역량을 희생하지 않고 어떻게 AI를 책임감 있게 사용할 수 있는지 분석합니다.
핵심 요약 (Key Takeaways)
- Berkeley CS 교수진은 비판적이지 않은 AI 도구 사용과 상관관계가 있는 낙제율의 측정 가능한 상승을 기록했습니다.
- 기초 수학을 건너뛰기 위해 AI를 사용하는 학생들은 제1원리 추론 (first-principles reasoning)을 요구하는 상급 과정 (upper-division courses)에서 어려움을 겪고 있습니다.
- 문제는 AI 자체가 아니라, 학생들이 AI를 어떻게 사용하는가에 있습니다.
- 구조화된 "AI 지원 학습 (AI-assisted learning)" 프레임워크는 이러한 추세를 반전시킬 가능성을 보여줍니다.
- 교육자와 학생 모두 지금 바로 실행할 수 있는 실질적인 단계들이 있습니다.
숫자는 거짓말을 하지 않는다: Berkeley의 CS 강의실에서 일어나고 있는 일
고등 교육 기술 뉴스를 팔로우해 오셨다면, 커지는 위기에 대한 소문을 들어보셨을 것입니다. 하지만 세계에서 가장 명성 있는 컴퓨터 과학 프로그램 중 하나인 UC Berkeley에서는 그 소문이 확고한 데이터가 되었습니다.
Berkeley의 EECS (Electrical Engineering and Computer Science) 학과 교수진은 2024년 말부터 한 가지 패턴을 포착하기 시작했으며, 이는 2025년과 2026년에 걸쳐 더욱 심화되었습니다: 핵심 CS 과정에서 낙제율이 급증하고 있으며, 그 원인은 비판적이지 않고 의존성을 형성하는 AI 사용으로 보입니다.
CS 61A (Structure and Interpretation of Computer Programs), CS 70 (Discrete Mathematics and Probability Theory), 그리고 CS 189 (Machine Learning)와 같은 과목들은 — 역사적으로 엄격하지만 준비된 학생이라면 통과할 수 있었던 과목들임에도 불구하고 — 2023년 이전 기준치와 비교했을 때 일부 섹션에서 낙제 및 중도 포기율이 15%에서 30% 이상까지 급증하고 있는 것으로 추정됩니다.
이러한 패턴은 더 이상 일화적인 수준에 그치지 않을 만큼 일관적입니다.
"ChatGPT를 이용해 작동하는 함수를 작성하게 할 수는 있지만, 왜 그것이 작동하는지 설명하지 못하는 학생들을 보고 있습니다. 시험에서 처음부터 직접 유도하라고 요구하면, 그들은 길을 잃습니다." — 2025년, 여러 Berkeley CS 강사 인터뷰 및 공개 포럼 게시글을 재구성함
[INTERNAL_LINK: 학생들을 위한 AI 도구: 도움이 되는 것 vs 해가 되는 것]
수학 능력 위기: 성적 저하보다 더 심각한 문제
낙제 성적은 하나의 증상일 뿐입니다. 그 근저에 깔린 질병은 더욱 우려스러운 것입니다: 바로 수학적 추론 능력 (mathematical reasoning ability)의 감소입니다.
CS에서 수학이 타협 불가능한 이유
컴퓨터 과학 (Computer science)은 본질적으로 응용 수학입니다. 이는 논쟁의 여지가 있는 의견이 아니라 구조적인 사실입니다. 기초 수학 능력이 CS 커리큘럼에서 뒷받침하는 내용은 다음과 같습니다:
- 이산 수학 (Discrete math) → 알고리즘 정당성 증명 (algorithm correctness proofs), 논리학 (logic), 그래프 이론 (graph theory)
- 선형 대수학 (Linear algebra) → 머신러닝 (machine learning), 컴퓨터 그래픽스 (computer graphics), 데이터 압축 (data compression)
- 확률 및 통계 (Probability and statistics) → ML 모델, 시스템 신뢰성 (systems reliability), A/B 테스트
- 미적분학 (Calculus) → 최적화 알고리즘 (optimization algorithms), 신경망 역전파 (neural network backpropagation)
- 정수론 (Number theory) → 암호학 (cryptography), 해싱 함수 (hashing functions)
학생들이 이러한 개념들을 파고드는 고통스러운 과정을 건너뛰기 위해 AI 도구를 사용할 때, 그들은 단순히 숙제 점수를 놓치는 것이 아닙니다. 그들은 상급 CS 과정이 전적으로 의존하는 **인지적 비계 (cognitive scaffolding)**를 구축하는 데 실패하고 있는 것입니다.
Berkeley 강사들이 관찰하고 있는 현상
강사들의 보고와 Berkeley CS 교수진의 공개 성명에 따르면, 이러한 퇴보는 인식 가능한 패턴을 따르고 있습니다:
- 1·2학년 시기 (Freshman/sophomore year): 학생이 수학 비중이 높은 과제(problem sets)를 완료하기 위해 AI를 사용합니다. 숙제에서는 괜찮은 성적을 받습니다.
- 중간/기말고사 (AI 사용 불허): 성적이 급락합니다. 학생은 아무것도 내면화(internalize)하지 못한 상태입니다.
- 고학년 과정 (Upper-division courses): 격차가 재앙적인 수준으로 벌어집니다. 학생들은 CS 170 (알고리즘) 또는 CS 189 (머신러닝, ML)와 같은 과목을 접하게 되지만, 질문을 이해하는 데 필요한 수학적 어휘조차 갖추지 못하고 있습니다.
이것이 이 추세의 핵심 메커니즘입니다: AI 도구는 과제에 대한 단기적인 성적 인플레이션 (grade inflation)을 가능하게 하는 동시에 장기적인 기술 퇴화 (skill atrophy)를 가속화하고 있으며 — 그 대가는 시험 때 치르게 됩니다.
[INTERNAL_LINK: 이산 수학을 효과적으로 공부하는 방법]
이것이 단지 Berkeley만의 문제인가?
짧은 답변은: 아닙니다.
Berkeley는 단지 이 문제를 공개적으로 드러낼 수 있을 만큼 충분한 데이터, 투명성, 그리고 목소리를 내는 교수진을 갖춘 최초의 엘리트 프로그램 중 하나일 뿐입니다. 다음과 같은 곳에서도 유사한 패턴이 보고되고 있습니다:
| 기관 유형 | 보고된 문제 | 타임라인 |
|---|---|---|
| UC Berkeley (주요 공립 대학) | CS 61A, CS 70의 낙제율 급증 | 2024–2026 |
| ... |
다시 말해, Berkeley CS 수업에서 AI 사용과 함께 낙제 성적이 급증하고 수학 능력이 줄어드는 현상은, 지금 이 문제를 해결하지 않는 모든 CS 프로그램에 닥칠 미래의 예고편입니다.
논란의 중심에 있는 AI 도구들
- 정당한 사용 (Legitimate use): 이미 기저 논리 (underlying logic)를 이해하고 있는 전문 개발자를 위한 자동 완성 (Autocomplete)
- 학생들의 오용 방식: 출력 결과물을 읽거나 이해하지 않은 채 숙제 정답 전체를 생성함
- 솔직한 평가: Copilot은 숙련된 개발자에게는 매우 뛰어난 생산성 도구입니다. 하지만 코딩을 배우는 학생이 비판 없이 이를 사용하는 것은, 누군가 대신 물리 치료 운동을 해주는 것과 거의 다름없습니다.
- 정당한 사용 (Legitimate use): 개념 설명, 가이드를 동반한 디버깅 (debugging), 소크라테스식 튜터링 (Socratic-style tutoring)
- 학생들의 오용 방식: "여기 문제 세트가 있으니, 정답을 알려줘"
- 솔직한 평가: ChatGPT는 사고를 '대체'하는 것이 아니라 '이해'하기 위한 용도로 사용한다면 학습 파트너로서 진정으로 유용합니다. 문제는 가장 저항이 적은 경로(path of least resistance)가 후자(대체)라는 점입니다.
- 정당한 사용 (Legitimate use): 개념적 설명, 학생과 '함께' 단계별로 증명 과정을 수행함
- 학생들의 오용 방식: ChatGPT의 오용 패턴과 동일함
- 솔직한 평가: 추론 과정을 심도 있게 설명하는 Claude의 경향 덕분에 학습 지향적 용도로는 약간 더 나을 수 있지만, 여전히 오용하기는 매우 쉽습니다.
- 정당한 사용 (Legitimate use): 작업 결과 확인, 수학적 개념의 시각화 (visualizing)
- 학생들의 오용 방식: 계산 방법을 이해하지 못한 채 계산 과정을 완전히 건너뜀
- 솔직한 평가: Wolfram Alpha는 2009년부터 존재해 왔으며 이러한 문제에 있어 새로운 것이 아닙니다. 하지만 거대언어모델 (LLMs)은 전체 정답 생성에 대한 마찰(friction)을 극적으로 낮추었습니다.
AI와 학습에 대해 연구가 실제로 말하는 것
Berkeley의 상황은 연구의 진공 상태에서 발생하는 것이 아닙니다. 2024~2026년 사이의 여러 연구가 불편한 결론으로 수렴하고 있습니다:
- 2025년 MIT의 한 연구에 따르면, 프로그래밍 과제를 수행하기 위해 LLM (Large Language Models)을 사용한 학생들은 문제를 수동으로 해결하며 고군분투한 학생들에 비해 후속 평가에서 **현저히 낮은 기억 유지력 (retention)**을 보였습니다.
- Stanford HAI 연구소의 연구는 문제 해결을 위해 AI를 반복적으로 사용하는 과정에서 학생들이 생산적인 고군분투 (productive struggle)에 참여하려는 의지가 감소하는 "인지적 오프로딩 (cognitive offloading)" 효과를 시사합니다.
- _Computers & Education_에 발표된 2024년 논문은 수학 숙제를 위해 AI를 사용한 학생들이 _더 높은 자신감_을 보고했으나, 독립적인 평가에서는 _더 낮은 성적_을 거두었다는 사실을 발견했습니다. 이는 우려스러운 자신감-역량 간의 격차 (confidence-competence gap)를 보여줍니다.
그 메커니즘은 신비로운 것이 아닙니다. 학습, 특히 수학과 프로그래밍에서는 **바람직한 어려움 (desirable difficulty)**이라고 불리는 것이 필요합니다. 즉, 지속적인 이해를 구축하는 생산적인 고군분투가 필요합니다. AI 도구는 오용될 경우 이러한 고군분투를 완전히 제거해 버립니다.
[INTERNAL_LINK: 학습의 과학: 바람직한 어려움에 대한 설명]
학생들이 지금 바로 할 수 있는 일: 실질적인 프레임워크
여기서부터 이 기사는 실행 가능한 지침을 제공합니다. 만약 당신이 Berkeley든 어디든 CS (Computer Science) 전공 학생이라면, 자신의 교육을 망치지 않고 AI를 사용하는 프레임워크는 다음과 같습니다.
"수용하기 전에 이해하라" 규칙
자신이 완전히 설명할 수 없는 AI 생성 코드나 수학 풀이를 절대 제출하지 마십시오. AI의 출력을 수용하기 전에 다음을 수행하십시오:
- 한 줄씩 읽으며 모든 구성 요소를 식별하십시오.
- AI 창을 닫고 스스로 솔루션을 재현해 보십시오.
- 만약 할 수 없다면, 그것을 배운 것이 아닙니다. 다시 AI로 돌아가 단순히 답을 구하는 것이 아니라 _설명_해 달라고 요청하십시오.
AI를 자판기가 아닌 튜터(Tutor)로 활용하라
프롬프팅 (prompting)의 차이는 매우 큽:
| 자판기식 프롬프트 (나쁨) | 튜터식 프롬프트 (좋음) |
|---|---|
| "이 점화식을 풀어줘" | "이 점화식에서 막혔어. 여기서 어떤 개념을 적용해야 할까?" |
| ... |
시험 성적을 보호하십시오
Berkeley의 시험은 여전히 대체로 AI를 사용하지 않는 환경입니다. 여러분의 성적은 도움 없이 스스로 수행한 능력에 달려 있습니다. 실천적인 단계는 다음과 같습니다:
- 모든 문제 세트의 최소 50%는 먼저 AI 없이 스스로 풀 것 — 진정한 노력을 기울인 후에만 AI를 참고하십시오.
- 매주 시간을 정해두고 AI 없이 연습 문제 풀기 — 실제 실력 수준을 측정하기 위해 수행하십시오.
- 스터디 그룹 형성 — 동료에게 개념을 설명하는 것은 인지 과학 (Cognitive Science)에서 알려진 가장 효율적인 학습 활동 중 하나입니다.
권장 학습 도구 (정당한 사용)
Anki — 간격 반복 (Spaced Repetition) 플래시카드 앱입니다. 수학적 정의, 정리 (Theorems), 그리고 컴퓨터 과학 (CS) 기초를 암기하는 데 탁월합니다. 무료이며 오픈 소스입니다.
Khan Academy — 수학 기초를 보강하기 위한 최고의 무료 리소스 중 하나입니다. 특히 선형 대수학 (Linear Algebra)과 확률론 (Probability) 분야가 강력합니다.
3Blue1Brown (YouTube) — Grant Sanderson의 시각적 수학 설명은 선형 대수학, 미적분학 (Calculus), 확률론에 대한 직관을 형성하는 데 진정으로 혁신적입니다.
교육자와 기관이 해야 할 일
여기서 주체성을 가진 것은 학생들만이 아닙니다. AI 사용과 함께 급증하는 낙제 성적과 Berkeley CS 수업에서의 수학 능력 저하는 부분적으로 커리큘럼 및 정책 설계의 문제입니다.
평가 개혁
- 구술 시험 (Oral Exams) 및 라이브 코딩 세션 확대 — 학생들이 실시간으로 자신의 논리적 근거를 설명해야 합니다.
- 과정 중심 평가 (Process-based Grading) — 정답뿐만 아니라 풀이 과정을 보여주는 것에 보상을 부여합니다.
- 단계별 과제 (Scaffolded Assignments) — 문제를 여러 단계로 나누어, AI를 이용한 통째로의 과제 완성이 덜 유용하게 만듭니다.
필수 역량으로서의 AI 리터러시 (AI Literacy)
AI를 전면적으로 금지하기보다는 (대체로 강제하기 어렵고 역효과를 낳음), 선도적인 교육자들은 학생들에게 다음과 같은 내용을 가르치는 **AI 리터러시 모듈 (AI Literacy Modules)**을 제안하고 있습니다:
- LLM (Large Language Models)이 실제로 어떻게 작동하며 왜 오류를 범하는지
- AI 보조 생산성 (AI-assisted productivity)과 AI 기반 의존성 (AI-enabled dependency)의 차이
- AI가 생성한 코드/수학을 감사(Audit)하고 검증(Validate)하는 방법
조기 개입 시스템 (Early Intervention Systems)
Berkeley와 동료 기관들은 숙제 성적이 시험 성적을 크게 앞지르는 학생들 — 즉, AI 의존성의 통계적 징후를 보이는 학생들을 식별하는 조기 경보 시스템 (Early warning systems)을 시범 운영하고 있습니다. 파일럿 프로그램에 따르면, 강의 시작 후 첫 4주 이내에 이루어지는 조기 개입은 유의미한 결과를 보여주었습니다.
더 큰 그림: 이것이 기술 산업에 의미하는 바
여기에는 불편한 후속 질문이 있습니다: 이 학생들이 졸업하면 어떤 일이 벌어질까요?
기술 산업은 이미 그 영향을 목격하기 시작했습니다. 주요 기술 기업의 채용 담당자들은 2025~2026년 코호트(Cohorts)의 신입 졸업생 후보자들이, 심지어 최상위권 프로그램 출신일지라도 알고리즘 인터뷰(Algorithmic interviews)나 화이트보드 수학 문제(Whiteboard math problems)를 통과하지 못하는 경우가 점점 늘어나고 있다고 보고합니다.
아이러니는 매우 날카롭습니다. 개발자의 생산성을 높여주기로 되어 있었던 바로 그 AI 도구들이, 교육 현장에서 오용될 경우, 실제로는 올바른 AI 사용에 필수적인 기초적 사고 능력이 결여된 개발자들을 양산하고 있습니다.
AI가 생성한 알고리즘이 틀렸을 때 이를 알아차리려면 알고리즘을 이해해야 합니다. ML (Machine Learning) 모델의 출력이 터무니없을 때 이를 알아차리려면 확률을 이해해야 합니다. AI는 역량을 증폭시킬 뿐, 역량의 필요성을 대체하지 않습니다.
자주 묻는 질문 (Frequently Asked Questions)
AI 자동 생성 콘텐츠
본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기