본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 05. 01. 13:13

LAPITHS: AI 성과에 대한 이론적 근거를 가진 해석을 위한 프레임워크로 Centaur(s) 다스리기

요약

LAPITHS는 '인간 유사성'에 대한 해석을 위한 이론적 근거 기반의 분석 프레임워크입니다. 이 프레임워크는 CENTAUR와 같은 최신 AI 모델이 제시하는 인공 통합 인지 모델 주장이 충분한 이론적 또는 경험적 정당성을 갖추지 못했음을 보여주는 데 사용됩니다. LAPITHS는 현재 AI 연구에서 흔히 발생하는, 트랜스포머 기반 언어 모델의 높은 성능을 인간 수준의 인지 능력으로 오해하는 행동주의적 경향에 대한 원칙적인 기준점을 제공하며, '최소 인지 그리드'와 '행동적 비교'라는 두 가지 정량적 평가를 통해 AI 주장의 근거를 엄격하게 검증합니다.

핵심 포인트

  • LAPITHS는 인간 유사성에 기반한 AI 성능 해석에 대한 이론적 기준점을 제공하는 분석 프레임워크이다.
  • 이 프레임워크는 CENTAUR와 같은 모델의 '인공 통합 인지 모델' 주장이 충분히 정당화되지 않았음을 지적한다.
  • LAPITHS는 트랜스포머 기반 언어 모델의 성공을 인간 수준의 인지 능력으로 해석하는 행동주의적 경향에 반대한다.
  • 주요 평가 방법으로는 '최소 인지 그리드(Minimal Cognitive Grid)'를 통한 인지 가능성 추정 및 독립적인 설명적 통찰이 부족한 '행동적 비교'가 있다.

우리는 인간 유사성 (Human likenesS) 에 대한 주제를 패러다임 기반 해석 (Paradigm grounded Interpretations of Theses) 을 통해 분석하는 언어 모델 (Language model) 분석 프레임워크인 LAPITHS 를 소개합니다. 우리는 CENTAUR 과 같은 주요 모델이 제안한 인공 통합 인지 모델 (artificial Unified Model of Cognition) 에 대한 여러 주요 주장들이 이론적 또는 경험적으로 정당화되지 않았음을 보여주기 위해 이 프레임워크를 사용합니다. LAPITHS 는 현재 AI 연구에서 트랜스포머 기반 언어 모델의 인간 수준 성과를 인간 유사한 기본 연산에 대한 증거로 해석하는 행동주의적 경향 (behaviouristic tendency) 에 대항하기 위한 원칙적인 기준점을 제공합니다. 이는 확장하여 인지 능력의 징후로 해석되는 것을 방지합니다. LAPITHS 의 혁신성은 두 가지 정량적 평가 (quantitative assessments) 에 기반한 주장을 명시적으로 만드는 데 있습니다: (i) 인공 시스템의 인지 가능성 (cognitive plausibility) 을 추정하기 위한 이론적으로 동기화된 방법인 최소 인지 그리드 (Minimal Cognitive Grid), 그리고 (ii) CENTAUR 같은 모델에서 보고된 결과와 유사한 결과가 일반적으로 인지 가능성과 관련된 구조적 제약 (structural constraints) 을 만족하지 않는 다른 시스템에서도 재현될 수 있으며, 이러한 시스템의 출력은 인간 인지에 대한 독립적인 설명적 통찰 (independent explanatory insight) 을 제공하지 않는다는 행동적 비교 (behavioural comparison) 입니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
2

댓글

0