본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 05. 13. 05:38

삭제할 것인가, 말 것인가? 숙의 과정 특권 분류를 위한 로컬 LLM 접근 방식

요약

정부 투명성 법률(FOIA 등)은 민감한 정보가 포함된 문서에서 내용을 삭제(redact)하도록 허용하는데, 본 논문은 LLM을 활용하여 '숙의 과정 특권'에 따른 자동 민감도 분류 방법을 제시합니다. 추가 분석 결과, 숙의 과정과 관련된 문장은 의견 표현 동사 사용 빈도가 높고 1인칭 시점의 표현이 많다는 특징을 발견했으며, 이 두 지표의 조합이 숙의성을 특징짓는 핵심 요소임을 밝혀냈습니다.

핵심 포인트

  • 정부 투명성 법률(FOIA)에 따른 문서 삭제(redaction) 과정에서 LLM 기반 자동 민감도 분류가 필요하다.
  • 숙의 과정 특권(deliberative process privilege)과 관련된 문서는 의견 표현 동사 사용이 높고 1인칭 시점의 표현이 많다.
  • 숙의성을 정확하게 식별하기 위해서는 단순히 하나의 지표가 아닌, 1인칭 단어와 의견 표현 동사의 조합적 분석이 효과적이다.

미국과 영국 등의 정보자유법(Freedom of Information, FOIA)이나 네덜란드의 우 법(Woo, Open Government Act)과 같이 정부 투명성 법률은 시민들에게 정부로부터 문서를 직접 요청할 권리를 부여합니다. 이러한 문서에는 개인 정보나 국가 안보에 대한 위협과 같은 민감한 정보가 포함될 수 있기 때문에, 해당 법률들은 정부가 공개 전에 문서의 민감한 부분을 삭제(redact)하도록 허용합니다. 우리는 이전 연구를 기반으로 대규모 언어 모델(LLM)을 사용하여 FOIA 예외 5조에 따른 숙의 과정 특권(deliberative process privilege)에 대한 자동 민감도 분류를 수행합니다. 하지만 아직 처리하지 못한 문서를...

추가 분석에서 우리는 숙의 과정에 관한 문장들이 의견 표현을 나타내는 동사를 더 많이 포함하고 있으며, 1인칭으로 표현되는 경우가 더 많다는 것을 발견했습니다. 무엇보다도, 숙의성은 여러 지표들의 조합, 특히 1인칭 단어와 의견 표현 동사의 조합에 의해 특징지어지는 것으로 보입니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.CL의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0