본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 06. 16. 12:07

IMPACTeen: 청소년 의사소통에서의 의도, 조작, 설득, 주석 및 결과 데이터셋

요약

IMPACTeen은 청소년의 디지털 및 사회적 상호작용 내 의도, 조작, 설득 기법을 다루는 텍스트 데이터셋입니다. LLM 생성과 인간의 검증을 거쳐 구축되었으며, 다양한 전문가 관점의 다차원적 주석을 포함합니다.

핵심 포인트

  • 청소년 맥락의 사회적 영향력 시나리오를 담은 데이터셋
  • LLM 생성 및 2단계 인간 편집을 통한 데이터 품질 확보
  • 다섯 가지 전문가/사용자 관점의 다차원적 주석 제공
  • 사회적 영향력 탐지 및 언어 모델 평가 연구 지원

IMPACTeen은 청소년 맥락 내에서 대인 관계, 미디어 기반 및 디지털 환경을 아우르는 텍스트 기반 사회적 영향력 시나리오 데이터셋입니다. 이 데이터셋은 1,021개의 텍스트, 5,100개의 개별 주석(annotation) 기록, 그리고 사회적 영향력 기법에 대한 골드 라벨(gold labels)을 포함하고 있으며, 각 텍스트는 청소년, 부모, 심리학자, 커뮤니케이션 전문가, 교사라는 다섯 가지의 서로 다른 관점에서 주석이 달렸습니다. 이 리소스는 제약 조건이 있는 LLM 생성(constrained LLM generation)을 통해 구축되었으며, 이후 청소년 맥락의 현실성을 보장하기 위한 2단계의 인간 편집 및 검증 단계를 거쳤습니다. 다차원적인 주석은 영향력의 존재 여부, 기법, 의도, 결과, 저항, 반응 및 주석 신뢰도를 다룹니다. 이 데이터셋은 사회적 영향력 탐지, 주석자 간 불일치(annotator disagreement), 교차 언어 모델링(cross-lingual modeling), 그리고 언어 모델의 학습 및 평가에 관한 연구를 지원합니다. 데이터셋은 폴란드어로 제작되었으며, 이에 상응하는 영어 버전이 함께 제공됩니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.CL (NLP)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0