EU 법률 자동화의 측정 격차: EU AI Act 하에서의 법리적 법률 추론 (Doctrinal Legal Reasoning) 벤치마킹
요약
현재 법률 AI 평가는 단순 보조 업무에 치중되어 있어, 법률 해석의 핵심인 법리적 법률 추론 능력을 측정하는 데 한계가 있습니다. EU AI Act의 고위험 AI 정확성 요구 사항을 충족하기 위해서는 이를 검증할 수 있는 새로운 벤치마크가 필요합니다.
핵심 포인트
- 기존 법률 AI 평가는 단순 보조 업무(paralegal tasks)에 편중됨
- 법리적 법률 추론(doctrinal legal reasoning)을 측정할 벤치마크 부재
- EU AI Act의 고위험 AI 정확성 규정을 위한 측정 방법론 필요
대규모 언어 모델 (Large language models)은 이제 최소한 중간 수준 이상의 법률 텍스트를 생성하지만, 현재 대부분의 법률 AI 평가가 측정하고 있는 부수적인 법률 보조 업무 (paralegal tasks)가 아니라, 법률 업무의 해석적 핵심을 형성하는 법리적 법률 추론 (doctrinal legal reasoning)을 수행하는지 여부를 평가할 수 있는 기존의 벤치마크는 존재하지 않습니다. 이러한 측정 격차는 방법론적일 뿐만 아니라 법률적이기도 합니다. EU AI Act는 사법 영역에서 사용되는 고위험 AI (high-risk AI)에 대해 "적절한 정확성 (appropriate accuracy)"을 구속력 있는 요구 사항으로 규정하고 있지만, 해당 요구 사항은 이 분야에 결여된 바로 그 법리적 추론 벤치마크 없이는 운영상의 내용을 확보할 수 없습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.CL (NLP)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기