본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 06. 18. 11:12

문항 풀의 품질 보증을 위한 분석 도구 (AQuAP): AI 기반 평가 시스템에서의 문항 은행 건강 상태 모니터링 및 유지 관리

요약

문항 은행의 품질과 건강 상태를 모니터링하기 위한 AI 기반 분석 도구인 AQuAP를 제안합니다. 유효 은행 크기(EBS)와 같은 새로운 지표를 통해 대규모 디지털 시험의 보안성과 효율성을 정량적으로 관리하는 프레임워크를 다룹니다.

핵심 포인트

  • 문항 품질 보증을 위한 대시보드 환경 AQuAP 제시
  • 유효 은행 크기(EBS)를 통한 독립적 시험 세션 구성 능력 정량화
  • 노출 및 사용 지표를 결합한 문항 은행의 보안성 및 다양성 분석
  • Duolingo English Test(DET) 사례를 통한 운영 분석의 실효성 입증

교육 평가의 대규모 디지털화로 인해 문항 은행 (item banks)에 대한 지속적인 감독이 필수적이면서도 복잡한 과제가 되었습니다. 본 논문은 문항 품질과 문항 은행의 건강 상태를 모니터링하기 위한 대시보드 환경인 Analytics for Quality Assurance for Item Pools (AQuAP)를 제시합니다. AQuAP는 자동화 및 인간 지원형 시험 개발 프레임워크인 Item Factory에 포함된, 고부담 시험 (high-stakes tests)을 위한 대규모 문항 생성 절차의 운영적 구현을 지원합니다. 본 논문은 문항 개발 프로세스와의 관계 속에서 AQuAP를 설명하고, 문항 풀 (item-pool) 품질 보증을 위한 광범위한 지표 프레임워크를 개괄하며, 풀의 활력을 나타내는 핵심 지표 중 하나인 유효 은행 크기 (Effective Bank Size, EBS)를 강조합니다. EBS는 콘텐츠 반복이 발생하기 전까지 얼마나 많은 독립적인 시험 세션을 구성할 수 있는지를 정량화하며, 노출 (exposure) 및 사용 (usage) 지표와 결합될 때 문항 은행의 보안성, 다양성 및 효율성에 대한 통찰을 제공합니다. 나아가 우리는 최대 노출 (maximum exposure), 최대 조건부 노출 (maximum conditional exposure), 조정된 유효 은행 크기 (adjusted effective bank size), 그리고 드물게 시행되는 비율 (rarely-administered fraction)과 같은 은행 건강 지표를 도입하며, 이들은 모두 문항 활용에 대한 시야를 확장합니다. AQuAP는 운영 분석 (operational analytics)이 어떻게 심리측정학적 (psychometric) 개념을 대규모 AI 지원 시험 프로그램의 품질 보증 도구로 변환할 수 있는지를 보여줍니다. 본 연구는 Duolingo English Test (DET) 프로세스를 통해 설명됩니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv Codex (cs.SE)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0