아랍어 사용 X(구 Twitter) 커뮤니티 내 정신 건강 담론의 사회문화적 차원 이해
요약
본 연구는 영어 중심의 계산 정신 건강 연구에서 벗어나, GPT-4.1을 활용해 아랍어 X(구 Twitter) 내 정신 건강 담론을 분석합니다. BPD, 양극성 장애, ADHD 관련 트윗을 통해 각 질환별 언어 패턴과 문화적 특징을 탐색적으로 제시합니다.
핵심 포인트
- GPT-4.1 기반의 아랍어 개인 공개 데이터 추출 파이프라인 제안
- 질환별(BPD, 양극성 장애, ADHD) 차별화된 언어 패턴 발견
- 다중 도메인 문화 키워드 프레임워크를 통한 언어 특징 규명
- 아랍어권 정신 건강 연구를 위한 가설 생성적 기초 마련
계산 정신 건강 연구 (Computational mental health research)는 주로 영어 사용 인구에 집중되어 왔으며, 이로 인해 아랍어 담론은 상대적으로 연구가 미진한 상태로 남아 있습니다. 본 연구에서는 GPT-4.1 개인 공개 (personal-disclosure) 파이프라인을 통해 세 가지 조건별 아랍어 X (구 Twitter) 커뮤니티 내에서 실제 경험을 가진 저자로 분류된 607명의 사용자로부터 추출한 8,147개의 트윗을 대상으로 탐색적 계산 연구를 제시합니다. 우리는 경계선 인격 장애 (BPD), 양극성 장애 (bipolar disorder), 그리고 ADHD와 관련된 담론에 초점을 맞추며, 다중 도메인 문화 키워드 프레임워크 (multi-domain cultural keyword framework)를 사용하여 커뮤니티 관련 언어 패턴을 특징짓습니다. 연구 결과, 본 코퍼스 (corpus)에서 양극성 장애 트윗은 더 많은 종교적 및 의학적 어휘를 포함하고 있으며, BPD 트윗은 관계적, 정체성 및 정서적 고통 관련 어휘를 더 많이 포함하고, ADHD 트윗은 실질적인 증상 및 약물 관리(medication management)에 더 자주 집중하는 것으로 나타났습니다. 본 코퍼스는 조건별로 불균형하며, 일부 하위 코퍼스 (subcorpora)는 시간적으로 집중되어 있고, 키워드 프레임워크는 검증된 측정 도구라기보다 초기 운영화 단계이므로, 우리는 이러한 패턴을 확증적이기보다는 가설 생성적 (hypothesis-generating)인 것으로 간주합니다. 본 논문은 재사용 가능한 LLM 지원 개인 공개 파이프라인과 아랍어 정신 건강 담론을 위한 탐색적 문화 키워드 프레임워크를 기여합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.CL (NLP)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기