arXiv논문2026. 06. 23. 14:23

자기 낙인은 단일한 개념이 아니지만, 일반적 공감은 그러하다: 약물 사용자(PWUD)를 위한 페르소나 조건부 LLM 지원

요약

약물 사용자의 자기 낙인 유형을 4가지 페르소나로 분류하고, 이를 기반으로 LLM의 응답을 최적화하는 연구를 제시합니다. 연구 결과, 페르소나 맞춤형 응답이 행동 변화에는 효과적이었으나 임상 전문가들은 일반적 공감을 더 선호하는 불일치를 보였습니다.

핵심 포인트

Reddit 데이터를 활용해 4가지 자기 낙인 페르소나 유형 도출
베이지안 및 RNN 분류기가 퓨샷 LLM보다 높은 페르소나 복구 성능 기록
페르소나 맞춤형 응답과 일반적 공감 사이의 임상적 불일치 확인
LLM 기반 낙인 지원 평가를 위한 정교한 루브릭 필요성 제기

자기 낙인(Self-stigma)은 약물 사용자(PWUD, People Who Use Drugs)의 치료 회피 및 이탈을 예측하지만, 지원을 제공하고자 하는 대화형 시스템은 일반적으로 자기 낙인 표현을 균일한 신호로 취급합니다. 우리는 LLM 지원을 위한 페르소나 인식 접근 방식에 대한 3단계 개념 증명(proof-of-concept) 연구를 제시합니다. Reddit의 1,174명 자기 낙인 표현자의 지표 수준 특징에 대한 잠재 프로파일 분석(LPA, Latent Profile Analysis)을 통해, 별도로 분리된 행동 및 언어적 특징을 통해 검증된 4가지 페르소나 유형론을 도출했습니다. 순차적 베이지안(Sequential Bayesian) 및 순환 신경망(recurrent neural) 분류기는 제한된 게시물 이력으로부터 이러한 페르소나를 복구하며, 배치(batch) 및 퓨샷(few-shot) LLM 베이스라인을 실질적으로 능가했습니다 (30개 게시물 기준 macro-F1 = 0.74). 세 가지 최신 LLM에 대해 8명의 임상 전문가가 수행한 평가 결과, 불일치(misalignment)가 드러났습니다. 페르소나에 맞춘 응답은 목표로 하는 행동 변화를 성공적으로 달성했으나, 평가자들은 전체적으로 페르소나 중립 베이스라인의 일반적 공감(generic empathy)을 선호했습니다. 우리의 연구 결과는 전체적인 공감 판단과 임상적으로 정렬된 응답 설계가 서로 반대 방향으로 작용할 수 있음을 시사하며, LLM 기반의 낙인 지원을 평가하기 위해서는 이 두 가지를 분해할 수 있는 루브릭(rubrics)이 필요함을 보여줍니다.

AI 자동 생성 콘텐츠

원문 바로가기

자기 낙인은 단일한 개념이 아니지만, 일반적 공감은 그러하다: 약물 사용자(PWUD)를 위한 페르소나 조건부 LLM 지원

요약

핵심 포인트

댓글