본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 05. 14. 13:27

AI가 생성한 슬라이드: 품질은 좋은가? 학생들은 구별할 수 있는가?

요약

본 논문은 생성형 AI(GenAI)가 강사의 강의 노트를 기반으로 슬라이드를 생성하는 방안을 조사하고, 강사와 학생의 인식을 분석했습니다. 연구 결과, 코딩 어시스턴트 도구들이 가장 정확하고 교육학적으로 타당한 슬라이드를 생성했으며, 학생들은 GenAI 슬라이드의 품질을 인간이 만든 것과 유사하게 평가하여 AI 생성 여부를 식별하지 못했습니다. 또한, 높은 품질의 슬라이드와 'AI 생성'이라는 출처 사이에 부적 상관관계가 발견되어, 학생들이 낮은 품질을 AI 기원과 연관 짓는 경향이 있음을 시사합니다.

핵심 포인트

  • 코딩 어시스턴트 도구들이 가장 정확하고 교육학적으로 타당한 슬라이드 생성을 지원한다.
  • 학생들은 GenAI 생성 슬라이드의 품질을 인간 제작물 수준으로 평가하여 출처를 식별하기 어려웠다.
  • 높은 품질의 콘텐츠와 'AI 생성'이라는 출처 사이에 부적 상관관계가 존재하며, 이는 학생들의 인식에 영향을 미친다.
  • GenAI는 교수 설계(instructional design) 워크플로우에 통합될 유망한 기회를 제공한다.

생성형 AI (GenAI) 도구에 대한 접근성이 높아짐에 따라, 이러한 도구를 강사(instructor)를 지원하는 데 사용하는 것에 대한 가능성이 열리고 있습니다. 이를 위해 본 논문은 강사가 작성한 강의 노트를 바탕으로 슬라이드 생성을 돕기 위해 GenAI를 사용하는 방안을 조사하며, 강사와 학생의 인식을 강조합니다. 우리는 엔드 투 엔드 (end-to-end) 교육 도구인 NotebookLM, 두 가지 범용 LLM (Claude, M365 Copilot), 그리고 두 가지 코딩 어시스턴트 (Cursor, Claude Code)를 조사합니다. 먼저 우리는 교육자들의 서사적 평가 (narrative assessment)를 통해 GenAI가 생성한 슬라이드가 "좋은지" 분석합니다. 우리는 실제 강의 환경에서 (약간의 수정을 거쳐) 사용할 가장 좋은 슬라이드를 선택하고, 인간이 생성한 슬라이드와 AI가 생성한 슬라이드에 대한 학생들의 인식을 비교합니다. 연구 결과, 코딩 어시스턴트 도구들이 가장 정확하고, 완전하며, 교육학적으로 타당한 (pedagogically sound) 슬라이드를 생성한다는 것을 발견했습니다. 또한, 학생들은 GenAI 슬라이드의 품질을 강사가 만든 슬라이드와 유사한 수준으로 평가했으며, 어떤 슬라이드가 AI에 의해 생성되었는지 신뢰성 있게 식별하지 못했습니다. 추가적으로, 우리는 높은 품질 평가와 높은 "AI 생성" 평가 사이에 부적 상관관계 (negative correlation)가 있음을 발견하였는데, 이는 학생들이 낮은 품질을 슬라이드의 출처가 AI인 것과 연관 짓고 있음을 시사합니다. 이러한 발견은 교수 설계 (instructional design) 워크플로우에 GenAI를 통합할 수 있는 유망한 기회를 강조하며, 교육자들이 어떻게 이러한 도구를 책임감 있고 효과적으로 가장 잘 활용할 수 있는지에 대한 추가적인 연구를 요구합니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.CL의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
1

댓글

0