arXiv논문2026. 06. 15. 04:03

상태가 아닌 특성: 사회적 하이라이팅(Social Highlighting)에서 독서 정체성의 지속성

요약

소셜 웹 하이라이팅 패턴이 개인의 일시적인 상태(state)인지 지속적인 특성(trait)인지 분석한 연구입니다. 24개월 이상의 장기 추적 결과, 개인의 선택 시그니처는 시간이 지나도 매우 안정적으로 유지됨을 확인했습니다.

핵심 포인트

하이라이팅 선택 패턴은 개인의 지속적인 '특성'으로 작용함
개인 프로필은 비개인적 정보보다 다음 읽을거리를 3배 높은 정밀도로 예측함
개인 내 관심사 드리프트(변화)는 매우 느리게 발생함
선택 시그니처는 특정 도메인 반복에 의존하지 않는 독립적 신호임

소셜 웹 하이라이터(social web highlighter)에 관한 이전 연구들은 개인이 하이라이트하기로 선택한 문서, 즉 선택(selection)에서 개별성을 찾아냈으나, 이를 횡단적(cross-sectionally)으로 측정했습니다. 우리는 시간적 질문을 던집니다: 독자의 선택 시그니처(selection signature)는 특성(trait)인가 아니면 상태(state)인가? 우리는 각 독자의 첫 6개월간의 하이라이팅을 하나의 프로필로 고정하고, 시간이 지남에 따라(24개월 이상까지) 이후의 선택에서 '자기 대 타(own-vs-other)'의 우위가 어떻게 변하는지 추적했습니다. 이때 대조군(negatives)은 동일한 달력 시기에서 추출하여, 공급 드리프트(supply drift)가 개인적 드리프트(personal drift)로 오인되지 않도록 했습니다. 이는 거친 글로벌 수준(coarse global level)과, 대조군 및 통제군이 독자 자신의 관심사 인접 영역(interest neighborhood)에서 추출되는 미세한 수준(fine level) 모두에서 수행되었습니다. 앵커 셀(anchor cell)은 이전의 횡단적 수준(+0.188 대 +0.169)을 재현하여 이 프레임워크를 검증했습니다. 네 가지 결과가 도출되었습니다. 동일 사용자 내에서, 미세 계층(fine-layer)의 우위는 어떤 시점에서도 통계적으로 감지 가능한 쌍체 감소(paired decline)를 보이지 않았습니다 (6-12개월 유지력 R = 1.00 [0.85, 1.18], n = 212; 가장 먼 구간은 완만한 감소와 호환 가능함; 구간이 0을 제외하는 유일한 대조는 12-24개월 시점의 거친 계층(coarse layer)이며, 약 13%임). 이 신호는 반복되는 도메인으로 환원되지 않습니다 (모든 프로필 소스를 제외해도 약 90%가 생존함). 개인 내 드리프트(Within-person drift)는 느립니다 (최근 절반의 프로필이 이전 절반보다 +0.042만큼 앞섭니다). 전망론적으로, 개인 프로필은 — 심지어 평가 시점으로부터 중앙값 20개월 전의 초기 문서들로 구축된 것이라 할지라도 — 테스트된 모든 단순 비개인적 사전 정보(non-personal prior)보다 다음 읽을거리를 약 3배 높은 AP(Average Precision)로 순위화합니다. 우리는 '특성(trait)'을 운영 정의상 '지속적인 참여 하에서의 안정적인 시그니처'로 사용합니다. 연구 범위는 한 플랫폼의 헤비 유저이자 장기 이용자이며, 노출(exposure)은 선택(choice)과 분리될 수 없습니다.

AI 자동 생성 콘텐츠

원문 바로가기

상태가 아닌 특성: 사회적 하이라이팅(Social Highlighting)에서 독서 정체성의 지속성

요약

핵심 포인트

댓글