본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 05. 26. 13:22

TRACE: 응용 행동 분석 (ABA)의 교수 프로그램 생성 및 세션 해석을 위한 분류 체계 기반 합성 데이터셋

요약

ABA(응용 행동 분석) 분야의 데이터 보안 문제를 해결하기 위해 제안된 합성 인스트럭션 튜닝 데이터셋 TRACE를 소개합니다. 이 데이터셋은 결정론적 분류 체계를 기반으로 교수 프로그램 생성 및 행동 로그 해석 작업을 위한 2,999개의 고품질 예시를 포함합니다.

핵심 포인트

  • HIPAA 규제로 인한 ABA 데이터 부족 문제 해결을 위한 합성 데이터셋 제안
  • DTT, NET, 과제 분석 등 다양한 ABA 교수 프로그램 생성 작업 포함
  • 12가지 궤적 패턴 및 13가지 목표 행동 기반의 세션 해석 작업 지원
  • 결정론적 분류 체계 기반 생성기로 데이터의 출처와 신뢰성 확보

응용 행동 분석 (Applied Behavior Analysis, ABA)은 문서화, 교수 프로그램 (teaching programs), 그리고 다중 세션 행동 로그 (multi-session behavioral logs)가 정형화되어 있고 양이 방대하지만, 실제 세션 데이터는 HIPAA (Health Insurance Portability and Accountability Act)의 보호를 받으며 전문적인 비밀 유지 규칙의 적용을 받기 때문에 훈련 코퍼스 (training corpus)의 공개가 차단되어 있습니다. 본 논문에서는 두 가지 ABA 작업을 다루는 2,999개의 예시로 구성된 합성 인스트럭션 튜닝 (instruction-tuning) 데이터셋인 TRACE (Taxonomy-Referenced ABA Clinical Examples)를 제시합니다. 이 데이터셋은 불연속 시행 훈련 (Discrete Trial Training, DTT), 자연 환경 교수 (Natural Environment Teaching, NET), 과제 분석 (Task Analysis)에 걸친 교수 프로그램 생성 작업과, 12가지 궤적 패턴 (trajectory patterns) 및 13가지 목표 행동 (target behaviors)에 걸친 다중 세션 행동 해석 작업을 포함합니다. 모든 예시는 정전(canonical) ABA 문헌에 근거한 결정론적 분류 체계 기반 생성기 (deterministic taxonomy-driven generator)에 의해 생성되었으며, 모든 예시는 이를 생성한 정확한 분류 체계 셀 (taxonomy cells)과 같은 완전한 샘플링 출처 (sampling provenance)를 포함합니다. 데이터셋은 데이터의 경우 CC BY-NC 4.0, 코드의 경우 MIT 라이선스로 공개되며, 층화된 훈련 (train, 2,549), 검증 (validation, 149), 테스트 (test, 281), 그리고 건전성 (sanity, 20) 분할로 구성됩니다. TRACE는 연구용 산물이며 임상적으로 검증되지 않았습니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv Codex (cs.SE)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0