arXiv논문2026. 05. 01. 13:13

LAPITHS: AI 성과에 대한 이론적 근거를 가진 해석을 위한 프레임워크로 Centaur(s) 다스리기

요약

LAPITHS는 '인간 유사성'에 대한 해석을 위한 이론적 근거 기반의 분석 프레임워크입니다. 이 프레임워크는 CENTAUR와 같은 최신 AI 모델이 제시하는 인공 통합 인지 모델 주장이 충분한 이론적 또는 경험적 정당성을 갖추지 못했음을 보여주는 데 사용됩니다. LAPITHS는 현재 AI 연구에서 흔히 발생하는, 트랜스포머 기반 언어 모델의 높은 성능을 인간 수준의 인지 능력으로 오해하는 행동주의적 경향에 대한 원칙적인 기준점을 제공하며, '최소 인지 그리드'와 '행동적 비교'라는 두 가지 정량적 평가를 통해 AI 주장의 근거를 엄격하게 검증합니다.

핵심 포인트

LAPITHS는 인간 유사성에 기반한 AI 성능 해석에 대한 이론적 기준점을 제공하는 분석 프레임워크이다.
이 프레임워크는 CENTAUR와 같은 모델의 '인공 통합 인지 모델' 주장이 충분히 정당화되지 않았음을 지적한다.
LAPITHS는 트랜스포머 기반 언어 모델의 성공을 인간 수준의 인지 능력으로 해석하는 행동주의적 경향에 반대한다.
주요 평가 방법으로는 '최소 인지 그리드(Minimal Cognitive Grid)'를 통한 인지 가능성 추정 및 독립적인 설명적 통찰이 부족한 '행동적 비교'가 있다.

우리는 인간 유사성 (Human likenesS) 에 대한 주제를 패러다임 기반 해석 (Paradigm grounded Interpretations of Theses) 을 통해 분석하는 언어 모델 (Language model) 분석 프레임워크인 LAPITHS 를 소개합니다. 우리는 CENTAUR 과 같은 주요 모델이 제안한 인공 통합 인지 모델 (artificial Unified Model of Cognition) 에 대한 여러 주요 주장들이 이론적 또는 경험적으로 정당화되지 않았음을 보여주기 위해 이 프레임워크를 사용합니다. LAPITHS 는 현재 AI 연구에서 트랜스포머 기반 언어 모델의 인간 수준 성과를 인간 유사한 기본 연산에 대한 증거로 해석하는 행동주의적 경향 (behaviouristic tendency) 에 대항하기 위한 원칙적인 기준점을 제공합니다. 이는 확장하여 인지 능력의 징후로 해석되는 것을 방지합니다. LAPITHS 의 혁신성은 두 가지 정량적 평가 (quantitative assessments) 에 기반한 주장을 명시적으로 만드는 데 있습니다: (i) 인공 시스템의 인지 가능성 (cognitive plausibility) 을 추정하기 위한 이론적으로 동기화된 방법인 최소 인지 그리드 (Minimal Cognitive Grid), 그리고 (ii) CENTAUR 같은 모델에서 보고된 결과와 유사한 결과가 일반적으로 인지 가능성과 관련된 구조적 제약 (structural constraints) 을 만족하지 않는 다른 시스템에서도 재현될 수 있으며, 이러한 시스템의 출력은 인간 인지에 대한 독립적인 설명적 통찰 (independent explanatory insight) 을 제공하지 않는다는 행동적 비교 (behavioural comparison) 입니다.

AI 자동 생성 콘텐츠

원문 바로가기

LAPITHS: AI 성과에 대한 이론적 근거를 가진 해석을 위한 프레임워크로 Centaur(s) 다스리기

요약

핵심 포인트

댓글