arXiv논문2026. 06. 15. 12:25

해석 가능한 워크플로로의 교차 도메인 액션 시퀀스 추상화

요약

사용자의 저수준 액션 로그를 상위 수준의 의미 있는 워크플로로 추상화하는 LLM 기반 프레임워크 WorkflowView를 제안합니다. 브라우저 로그 재구성, 학생 중도 탈락 예측 등 다양한 도메인에서 높은 성능과 일반화 능력을 입증했습니다.

핵심 포인트

LLM을 활용해 노이즈가 많은 저수준 로그를 해석 가능한 활동으로 변환
브라우저 로그 재구성에서 높은 의미적 유사도(0.91) 달성
5개의 퓨샷 예시만으로 MOOC 학생 중도 탈락 예측 성공
계산 효율성 및 개인정보 보호를 고려한 실질적 배포 방안 논의

순차적(Sequential) 또는 타임스탬프가 찍힌 상호작용 로그는 디지털 애플리케이션 사용에 대한 객관적인 기록을 제공하지만, 그 입도(granularity)와 노이즈로 인해 사람들의 작업에 대한 의미 있는 통찰을 얻는 데 어려움이 있는 경우가 많습니다. 이러한 통찰은 실제 사용자 상호작용에 기반하여 디지털 제품을 개선하는 데 필수적입니다. 이전 연구들은 딥러닝 (Deep Learning) 모델을 적용하여 사용자 액션을 상위 수준의 활동으로 클러스터링(clustering)해 왔으나, 이러한 접근 방식은 노이즈에 매우 민감하며 애플리케이션 간의 일반화(generalize)에 어려움을 겪습니다. 이러한 한계를 해결하기 위해, 우리는 대규모 언어 모델 (LLMs)을 사용하여 저수준 액션 시퀀스를 상위 수준의 활동으로 추상화하는 프레임워크인 WorkflowView를 소개합니다. 우리는 세 가지의 서로 다른 도전적인 순차적 작업 및 다양한 도메인에 걸쳐 우리 접근 방식의 효과성과 일반성을 입증했습니다: (a) 브라우저 로그로부터의 제로샷 (zero-shot) 작업 설명 재구성 (높은 의미적 유사도, $μ_{sim} = 0.91$ 달성), (b) MOOC 상호작용 로그를 사용한 퓨샷 (few-shot) 학생 중도 탈락 예측 (단 5개의 퓨샷 예시만으로 가중 $F_1 = 0.90$ 도달), (c) Microsoft Word 내 문서 워크플로에서의 AI 도구 통합에 대한 익명화된 개인정보 보호 분석. 우리의 연구는 LLM 기반의 추상화가 저수준 행동 데이터를 상위 수준의 해석 가능하고 실행 가능한 통찰로 변환하는 견고하고 효율적인 경로임을 보여줍니다. 또한 우리는 계산 효율성과 사용자 개인정보 보호를 포함하여, 로깅 인프라 내에서 LLM 기반 추론을 배포하기 위한 실질적인 고려 사항에 대해서도 논의합니다.

AI 자동 생성 콘텐츠

원문 바로가기

해석 가능한 워크플로로의 교차 도메인 액션 시퀀스 추상화

요약

핵심 포인트

댓글