arXiv논문2026. 06. 26. 11:07

설명 가능한 판결 변동성을 향하여: 게이트형 멀티태스크 학습(Gated Multi-Task Learning)을 통한 사법적 재량의 정량화

요약

사법적 재량을 정량화하기 위해 게이트형 멀티태스크 학습(Gated Multi-Task Learning) 아키텍처를 제안합니다. Gemma-4 26B-A4B를 기반으로 판사 정체성과 판결 맥락을 분리하여 모델링함으로써, 기존 SFT 방식보다 적은 파라미터로 SOTA 성능을 달성했습니다.

핵심 포인트

게이트형 멀티태스크 학습을 통한 사법적 재량의 명시적 모델링
Gemma-4 백본 기반의 LoRA 결합으로 파라미터 효율성 10배 향상
모호하고 드문 결과 클래스에서 뛰어난 성능 향상 입증
판사 임베딩을 통한 판결 맥락의 해석 가능성 확보

법적 결과 예측은 객관적인 사건 사실(case facts)을 판결 맥락(adjudicative context)으로부터 분리해야 합니다. 실체적 근거에 기반한 판결은 사실적 증거에 의존하는 반면, 기술적 처분은 사법적 재량(judicial discretion)에 좌우될 수 있습니다. 본 연구에서는 이러한 구분을 명시적으로 모델링하는 판사 인식 게이트형 멀티태스크 학습(Judge-Aware Gated Multi-Task Learning) 아키텍처를 제안합니다. 우리는 인코더를 감독하기 위해 세분화된 결과 분류 체계(outcome taxonomy)를 도입하여, 서로 다른 의미론적 경로를 분리하는 구조적 정규화(structural regularization)를 강제합니다. 이러한 세밀한 법률 커리큘럼은 우리의 게이트 융합(Gated Fusion) 메커니즘이 판사의 정체성(judge identity)에 대한 의존도를 동적으로 조절할 수 있게 합니다. 우리는 13,937건의 영국 고용 심판소(UK Employment Tribunal) 판결을 통해 우리의 접근 방식을 평가합니다. 우리는 판사 정체성과 분류 체계를 프롬프트 토큰(prompt tokens) 또는 자기회귀 출력 타겟(autoregressive output targets)으로 주입한 Gemma-4 26B-A4B 백본의 지도 미세 조정(Supervised Fine-Tuning, SFT) 방식과 우리의 설계를 벤치마크하여 비교합니다. 두 맥락 신호는 단일 자기회귀 채널을 통해 강제될 때 매우 약하게 결합됩니다. 반면, LoRA가 적용된 Gemma-4 인코더를 우리의 게이트형 아키텍처와 결합하면, 생성형 SFT 베이스라인보다 학습 가능한 파라미터 수를 10배 적게 사용하면서도 이 벤치마크에서 새로운 SOTA(State of the Art)를 정의하며, 특히 가장 모호하고 드문 결과 클래스에서 성능 향상이 집중됩니다. 정확도를 넘어, 이 아키텍처는 해석 가능합니다. 학습된 판사 임베딩(judge embeddings)과 보정 프로필(calibration profiles)은 판결 맥락이 예측을 주도하는 사례를 국소화합니다. 이러한 결과는 법적 결과의 정체성 조건부 분류(identity-conditioned classification)에 있어, 조건부 인터페이스(conditioning interface)의 선택이 규모(scale)보다 더 중요하다는 것을 나타냅니다. 즉, 미분 가능한 구조적 결합(differentiable structured composition)은 훨씬 더 큰 백본을 사용하는 프롬프트 기반 결합보다 더 정확하고 파라미터 효율적인 모델을 생성합니다.

AI 자동 생성 콘텐츠

원문 바로가기

설명 가능한 판결 변동성을 향하여: 게이트형 멀티태스크 학습(Gated Multi-Task Learning)을 통한 사법적 재량의 정량화

요약

핵심 포인트

댓글