PeerMathDial: 중학생의 협력적 수학 문제 해결을 위한 대화 데이터셋
요약
중학생들의 협력적 수학 문제 해결(CPS) 과정을 담은 최초의 동료 간 대화 데이터셋인 PeerMathDial을 소개합니다. LLM을 활용해 대화 행위 분류 체계를 구축하였으며, 대화 진화 추적 및 학생 특성 분석 등 다양한 연구 활용 가능성을 입증했습니다.
핵심 포인트
- 중학생 27명의 수학 협력 대화 6,406턴 포함
- LLM 기반의 대화 행위(dialogue act) 분류 체계 구축
- 대화 흐름 추적 및 학생 특성(자신감, 리더십) 연관성 분석 가능
- 교육용 LLM 시뮬레이션 및 학생 행동 예측 연구 지원
협력적 문제 해결 (Collaborative Problem Solving, CPS)은 교육의 핵심 기술이며, 여기서 동료 간 상호작용 과정은 매우 중요합니다. 그러나 기존의 교육용 대화 데이터셋은 대부분 교실 수업이나 튜터링 (즉, 교사/튜터-학생 간 상호작용)에 집중되어 있으며, 소그룹 형태의 학생-학생 간 상호작용을 중심으로 하는 데이터셋은 제한적입니다. 이로 인해 실제 교육 환경에서 학생들이 어떻게 상호작용하고, 조율하며, 함께 문제를 해결하는지를 연구하기 위한 자원이 부족한 실정입니다. 이를 해결하기 위해, 우리는 실제 중학교 수학 교실에서 수집한 최초의 동료 CPS 대화 데이터셋인 PeerMathDial을 소개합니다. 이 데이터셋은 27명의 학생으로부터 수집된 총 6,406턴의 대화 55개를 포함하고 있습니다. CPS 담화 분석 연구를 촉진하기 위해, 우리는 LLM (Large Language Models)의 도움을 받아 코퍼스에 기반한 대화 행위 (dialogue act) 분류 체계를 구축했습니다. 이 데이터셋과 대화 행위 분류 체계를 사용하여, 우리는 세 가지 유스케이스를 통해 PeerMathDial의 실질적인 활용 가능성을 입증합니다. 첫째, 대화가 시간에 따라 어떻게 진화하는지 추적하고 교사의 개입이 미치는 영향을 측정합니다. 둘째, 대화 행위를 학생 설문 조사와 정렬하여 학생의 특성 (예: 자신감, 리더십)과 실제 행동 사이의 연관성을 밝힙니다. 셋째, 대화 행위 예측에 대한 LLM의 성능을 평가함으로써, 교육 애플리케이션 내 학생 시뮬레이션에 대한 LLM의 잠재력을 엿봅니다. 우리의 데이터셋과 소스 코드는 커뮤니티에 공개될 예정입니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.CL (NLP)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기