arXiv논문2026. 06. 23. 12:22

어휘적 합의 (Lexical Consensus): 인공 에이전트의 접지된 단어 학습과 공유된 의미

요약

인공 에이전트가 시각적 경험을 통해 단어의 의미를 학습하고 안정화하는 과정을 연구한 논문입니다. DINOv2 임베딩을 활용해 지각적 거리와 어휘적 접지 사이의 상관관계를 분석하며, 명명과 인출 메커니즘의 차이를 규명합니다.

핵심 포인트

지각적 거리가 어휘 습득 정확도를 예측하는 핵심 지표임
의미적 관련성보다 지각적 일관성이 학습에 더 큰 영향을 미침
명명(Naming)과 인출(Retrieval)은 서로 다른 메커니즘으로 작동함
동결된 지각 기하학은 접지를 가능케 하나 학습 범위를 제한함

인공지능 (AI) 시스템은 일반적으로 작업 성능과 행동 모방을 통해 평가되지만, 이러한 평가 방식은 인공 에이전트가 접지된 경험 (grounded experience)으로부터 새로운 어휘적 의미를 습득, 안정화 및 사용할 수 있는지에 대한 의문을 남깁니다. 본 논문은 구조화된 지각 기질 (perceptual substrate) 위에서 접지된 단어 학습을 연구하기 위한 실험적 프레임워크인 어휘적 합의 (Lexical Consensus)를 소개합니다. 동결된 DINOv2 시각적 임베딩 (visual embeddings), Carroll 스타일의 가짜 단어 (nonce words), 그리고 해석 가능한 어휘 학습기 (lexical learners) 및 선형 베이스라인 (linear baselines)을 사용하여, 우리는 에이전트가 시각적 개념에 대한 인공적 레이블을 습득하고, 이를 양방향으로 일반화하며, 통제된 환경에서 이를 안정화할 수 있는지 테스트합니다. 주요 결과는 강력한 지각적 일관성 경사 (perceptual-coherence gradient)입니다: 타고난 범주 (native categories)가 가장 배우기 쉬우며, 일관된 과잉 확장 (coherent overextensions)은 여전히 학습 가능하지만, 중간 범위의 분리적 개념 (disjunctive concepts)은 성능이 저하되고, 멀리 떨어진 분리적 개념은 무작위 확률에 수렴합니다. 사전 등록된 CIFAR-100 해리 (dissociation) 실험은 이 경사가 의미적 관련성 (semantic relatedness)보다는 지각적 거리 (perceptual distance)에 의해 지배됨을 확인합니다: 지각적 거리는 습득 정확도를 예측하지만 (partial R^2 = 0.245, p < 1e-7), 의미적 거리는 유의미한 설명력을 더하지 못합니다 (partial R^2 = 0.002, p = 0.660). 양방향 평가 결과, 명명 (naming)과 인출 (retrieval)은 서로 다름을 보여줍니다: 예시 기반 메커니즘 (exemplar-based mechanisms)은 레이블-이미지 인출에서 중심 프로토타입 (centroid prototypes)보다 우수한 성능을 보이며, 이는 명명 정확도와는 별개인 메모리 충실도 (memory-fidelity) 차원을 드러냅니다. 반증 제어 (Falsification controls), 균질한 후보 풀 (homogeneous candidate-pool) 평가, 그리고 표현 재구조화 (representational restructuring)에 대한 무효 결과 (null results)는 동결된 지각 기하학 (frozen perceptual geometry)이 어휘적 접지 (lexical grounding)를 가능하게 하는 동시에, 표현 적응 (representational adaptation) 없이는 습득할 수 있는 범위를 제한한다는 것을 나타냅니다.

AI 자동 생성 콘텐츠

원문 바로가기

어휘적 합의 (Lexical Consensus): 인공 에이전트의 접지된 단어 학습과 공유된 의미

요약

핵심 포인트

댓글