arXiv논문2026. 05. 18. 20:02

CitePrism: 인적 개입 기반의 인용 감사 및 편집 무결성을 위한 AI 프레임워크

요약

CitePrism은 편집자와 심사위원이 원고의 인용 정확성과 윤리성을 검토할 수 있도록 지원하는 AI 기반 하이브리드 의사결정 프레임워크입니다. LLM의 문맥 추론과 임베딩 기반 유사성 분석을 결합하여 인용의 관련성을 평가하며, 인간의 검토를 병행하는 Human-in-the-loop 방식을 채택하고 있습니다. 현재는 완전 자동화된 시스템이 아닌, 편집 프로세스를 보조하는 파일럿 단계의 의사결정 지원 도구로 설계되었습니다.

핵심 포인트

LLM 문맥 추론과 임베딩 기반 의미론적 유사성을 결합한 하이브리드 접근 방식 제공
인용 문맥, 메타데이터 품질, 자기 인용 패턴 및 서지 무결성 검증 기능 포함
인간의 판단을 보조하는 'Human-in-the-loop' 분석가 검토 프로세스 설계
포장 공학 사례 연구 결과, 인간의 레이블과 일정 수준의 일치도(Cohen's kappa = 0.429) 확인
자율적인 부정행위 탐지기가 아닌, 보수적인 편집 스크리닝을 위한 의사결정 지원 도구로 정의

편집자(Editors)와 심사위원(Reviewers)은 원고가 관련성 있고, 정확하며, 최신이며, 윤리적으로 적절한 문헌을 인용하는지 확인해야 하지만, 원고 수준의 인용 감사(Citation auditing)는 여전히 수동적이고 파편화되어 있으며 확장하기 어렵습니다. 인용 문맥(Citation context), 메타데이터 품질, 자기 인용(Self-citation) 패턴, 그리고 서지 무결성(Bibliographic integrity)은 모두 참조 문헌이 국소적 주장(Local claim)을 적절히 뒷받침하는지 여부에 영향을 미칩니다. 본 논문에서는 LLM 지원 문맥 추론(Contextual reasoning), 임베딩 기반 의미론적 유사성(Embedding-based semantic similarity), 메타데이터 검증, 무결성 중심 플래그(Integrity-oriented flags), 그리고 인간 참여형(Human-in-the-loop) 분석가 검토를 결합한 편집 인용 감사를 위한 투명한 하이브리드 의사결정 지원 프레임워크인 CitePrism을 제시합니다. CitePrism은 인용 이웃(Citation neighborhoods)을 추출하고, 참조 메타데이터를 풍부하게 하며, 융합된 관련성 점수(Fused relevance scores)를 계산하고, 메타데이터 및 자기 인용 검토 프롬프트를 노출하며, 설정 가능한 임계값 기반의 분류(Triage)를 지원합니다. 포장 공학(Pavement engineering) 분야의 104개 참조 문헌을 포함한 단일 사례 연구 원고에 대한 예비 검증 결과, 인간의 이진 관련성 레이블(Binary relevance labels)과의 일치도는 Cohen's kappa = 0.429에 도달했습니다. 작동 임계값 tau = 17에서 CitePrism은 인간이 무관하다고 레이블을 붙인 모든 인용을 식별해냈으나, 분석가의 검토가 필요한 위양성(False positives)도 생성했습니다. 이러한 결과는 CitePrism이 보수적인 편집 스크리닝 및 인용 품질 분류를 지원할 수 있음을 시사하지만, 일반적인 편집 성능을 확립하는 것은 아닙니다. CitePrism은 자율적인 부정행위 탐지기(Misconduct detector)나 자동화된 편집 결정 시스템이 아닌, 파일럿 단계의 의사결정 지원 도구로 설계되었습니다. 실제 운영에 사용하기 전에는 다양한 원고, 도메인, 주석가(Annotators), 베이스라인 및 배포 환경에 걸친 광범위한 검증이 필요합니다.

AI 자동 생성 콘텐츠

원문 바로가기

CitePrism: 인적 개입 기반의 인용 감사 및 편집 무결성을 위한 AI 프레임워크

요약

핵심 포인트

댓글