arXiv논문2026. 06. 15. 07:31

표준 해석 가능 모델(SIM): 라그랑지안 역학을 이용한 해석 가능한 방법론의 연역적 설계에 대한 일반 이론

요약

라그랑지안 역학을 기반으로 해석 가능한 모델을 연역적으로 설계할 수 있는 일반 이론인 SIM(Standard Interpretable Model)을 제안합니다. SIM은 해석 가능성의 전제 조건을 체계화하여 기존 방법론의 한계를 극복하고 새로운 연구 방향을 제시합니다.

핵심 포인트

라그랑지안 역학을 이용한 해석 가능 모델의 연역적 설계 이론 제안
해석 가능성 대칭성과 제약 조건을 통한 최적 모델 도출
기존의 파편화된 해석 가능성 방법론들을 통합하는 프레임워크
해석 가능성 연구 및 교육을 위한 과학적 기반 제공

인공지능 모델이 복잡해짐에 따라, 해석 가능성(interpretability)은 그 계산 과정을 이해하고, 디버깅하며, 제어하는 데 필수적인 도구가 되었습니다. 하지만 해석 가능성은 해석 가능한 방법론을 연역적으로 설계할 수 있는 일반 이론이 부족합니다. 이러한 이론과 방법론 사이의 간극은 파편화된 문헌과 일관성 없는 평가 프로토콜을 초래합니다. 이 간극을 메우기 위해, 우리는 라그랑지안 역학에 기반한 일반 이론인 표준 해석 가능 모델(Standard Interpretable Model, SIM)을 소개합니다. SIM은 목표 사용자에게 해석 가능성이 무엇인지의 전제 조건들을 한 세트로 요약합니다. 이러한 전제 조건들로부터, SIM은 해석 가능성 대칭성과 그에 상응하는 제약 조건들을 체계적으로 도출하며, 이는 최적의 해석 가능한 모델에 대응하는 라그랑지안 함수의 지형을 형성합니다. 이 최소값(minima)에 도달하기 위해, 사람들은 불투명한 모델의 매개변수 값을 업데이트하여 더 해석 가능하게 만들거나, 제약 조건들을 해석 가능한 아키텍처로 컴파일할 수 있습니다. 우리는 SIM이 기존 방법론들(전통적, 개념 기반, 메커니즘적 해석 가능성 포함)의 한계를 식별하고 해결하며, 아직 충분히 탐구되지 않은 연구 방향을 강조하고, 핵심 프로그래밍 인터페이스 설계를 위한 정보를 제공한다는 것을 경험적으로 보여줍니다. SIM은 단순한 연구 방법론을 넘어, 그 연역적인 특성은 해석 가능성 교육과정(curricula)에 대한 교육학적 기반을 제공하며, 오랫동안 파편화되어 온 학문 분야에 대한 과학계의 관점을 바꿀 수 있습니다.

AI 자동 생성 콘텐츠

원문 바로가기

표준 해석 가능 모델(SIM): 라그랑지안 역학을 이용한 해석 가능한 방법론의 연역적 설계에 대한 일반 이론

요약

핵심 포인트

댓글