Insights
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
arXiv cs.AI 2012건필터 해제
샘플링이 선택을 의미하지 않는 이유: 대규모 언어 모델에서의 의도성, 주체성, 그리고 도덕적 책임
본 논문은 LLM이 보여주는 '주체성'이나 '도덕적 행위자'라는 주장이 오해라고 반박합니다. LLM의 작동 방식은 데이터 기반 확률적 입력-출력 매핑에 불과하며, 진정한 의도성이나 약속 이행을 위한 자기 귀속된 행동이 결여되어 있음을 주장합니다.
지침 파일이 에이전트의 풀 리퀘스트에 미치는 영향 연구: Instructions-as-Code를 향하여
본 논문은 AI 에이전트의 풀 리퀘스트(Agentic-PRs) 생성에 사용되는 지침 파일(instruction files)의 효과를 분석했습니다. 연구 결과, 지침 파일을 사용하는 것이 항상 더 나은 결과를 보장하지는 않으며, 병합률 증가와 감소가 혼재하는 것으로 나타났습니다. 성공적인 프로젝트들은 구조화되고 긴 지침 파일을 가진 경향을 보였습니다.
온톨로지 메모리 증강 ASR 교정을 위한 장문 텍스트-음성 혼합 대화
본 논문은 장문 텍스트와 음성이 혼합된 대화 환경에서 발생하는 ASR(자동 음성 인식) 교정의 한계를 극복하기 위한 새로운 프레임워크를 제안합니다. 이 방법은 이전 상호작용 기록을 온톨로지 메모리로 구성하여 개체, 용어, 의미 관계 등을 저장하고 검색 가능한 노드로 활용합니다. 실험 결과, 이 프레임워크는 기존 방식보다 문맥 의존적 ASR 오류에 대해 더 정확하고 증거 기반의 교정을 제공함을 입증했습니다.
MaxProof: 생성기-검증기 RL 및 개체 수준 테스트 시간 스케일링으로 수학적 증명 확장
본 글은 MiniMax-M3 시리즈를 위한 개체(population)-수준 테스트 시간 스케일링 프레임워크인 MaxProof를 소개합니다. MaxProof는 증명 생성, 검증, 복구 기능을 통합하여 모델의 성능을 향상시켰습니다. 이 방법을 통해 M3 모델은 IMO 2025와 USAMO 2026 등 주요 수학 경시대회에서 인간 금메달리스트 수준을 초과하는 높은 점수를 달성했습니다.
자율주행 위험 감지를 위한 비전-언어 모델의 태스크 정렬 안정성 분석
본 연구는 자율주행 분야에서 사용되는 비전-언어 모델(VLMs)의 강건성을 분석했습니다. 단순히 임베딩 안정성만 보는 것이 아니라, 손상으로 인한 '태스크 정렬 위험 점수' 변화를 측정하여 모델의 취약점을 파악했습니다. 그 결과, 다양한 종류의 드리프트와 손상이 비대칭적인 실패 모드(오경보/거짓 음성)를 유발함을 밝혀냈습니다.
DuoBench: 시뮬레이션 및 실제 환경에서의 양손 조작을 위한 재현 가능한 벤치마크
DuoBench는 양손 로봇 시스템의 협응 능력을 평가하기 위해 설계된 확장 가능한 벤치마킹 프레임워크입니다. 이 프레임워크는 시뮬레이션과 실제 하드웨어 환경에서 총 11개의 작업을 포함하며, 네 가지 협응 범주를 다룹니다. DuoBench는 단순 성공 여부를 넘어선 세밀한 의미론적 실패 분석을 지원하여 로봇 정책 연구에 기여합니다.
호흡음 분류를 위한 품질 적응형 각도 마진 학습
본 논문은 클래스 내 응집성과 클래스 간 분리성을 강화하는 품질 적응형 각도 마진 학습 프레임워크 QLung을 제안합니다. 이 프레임워크는 오디오 녹음 품질에 따라 각도 마진을 동적으로 조정하며, 특히 아웃-오브-디스트리뷰션(OOD) 환경에서 뛰어난 성능을 입증했습니다.
GPU 기반 LLM 서빙 시스템의 소프트웨어 노화 특성 분석
본 논문은 GPU 기반 LLM 서빙 시스템에서 발생하는 소프트웨어 노화 현상을 연구하는 경험적 방법론을 제안합니다. 기존 CPU 중심의 연구와 달리, 변동성이 큰 워크로드를 처리하는 LLM 환경에 초점을 맞췄습니다. 216시간 캠페인과 통계적 분석을 통해 모든 배포 환경에서 메모리 노화를 확인하고, 그 원인이 서빙 런타임 및 구성에 크게 의존함을 밝혀냈습니다.
질문(Interrogation)의 기술: 일관성이 공간 추론의 사실성을 증폭시킨다
본 연구는 대규모 추론 모델(LRMs)의 공간 추론 능력 부족 문제를 다룹니다. 기존 방식이 외부 데이터에 의존하는 것과 달리, 본 논문은 정답 주석 없이 내부 추론 과정의 '논리적 일관성'을 강화하는 자기 지도 RL 프레임워크를 제안합니다. 이를 통해 모델이 기하학적/의미적 일관성을 학습하여 공간 추론 능력을 향상시킬 수 있음을 입증했습니다.
Lung-SRAD: 호흡 소리 분류를 위한 이중 축 패치-믹스 대조 학습을 적용한 스펙트럼 인식 정규화 오디오 DASS
본 연구는 호흡 소리 분류(RSC)의 한계점을 극복하기 위해 State Space Models (SSMs)를 대안 백본으로 제안합니다. 여기에 스펙트럼 인식 레이어 정규화와 이중 축 패치-믹스 대조 학습을 결합하여 강력한 표현 학습을 수행했습니다. ICBHI 벤치마크에서 AST 대비 성능 향상을 입증하며, 관련 코드를 공개했습니다.
인간 증강 루프 모델링 (HELM): 콘크리트 교량 방호벽의 에이전트 기반 유한 요소 모델링
본 논문은 교량 방호벽 같은 안전 필수 인프라의 유한 요소(FE) 모델링 과정에 인간-에이전트 협업 프로토콜인 HELM 프레임워크를 제시합니다. 이 프레임워크는 복잡한 FE 모델링을 시각적으로 검증 가능한 체크포인트로 분해하여 자동화 및 정확도를 높입니다. 실험 결과, HELM은 기본 자율 모델링 성공률을 20%에서 75%로 향상시키는 효과를 입증했습니다.
메타데이터 기반 다중 프롬프트 추론을 통한 제로샷 사고 이해
본 논문은 감시 영상 속 사고를 '언제', '무엇을', '어디서'로 분해하는 3단계 파이프라인을 제안합니다. 비전-언어 유사성, 메타데이터 기반 다중 프롬프트 추론, 오픈 어휘 검출기를 활용하여 충격 발생 시점을 정확히 식별하고 사고 유형과 공간적 위치를 국소화했습니다.
GAN과 memristor 기반 분류기를 이용한 비정면 얼굴 인식
본 연구는 GAN 기반 자세 정면화와 memristor 뉴로모픽 인식 시스템을 결합한 비정면 얼굴 인식 프레임워크를 제안했습니다. 이 접근 방식은 계산 오버헤드를 줄여 드론 등 자원 제한 플랫폼에서의 현장 적용 가능성을 높입니다. 실험 결과, 최대 96%의 높은 식별 정확도를 달성하며 효율적인 솔루션을 제시합니다.
잠재 지식 추출의 불가능성
본 논문은 AI 에이전트가 자신의 세계 지식에 대해 '정직함(honest)'을 유지하도록 훈련시키는 문제, 즉 잠재 지식 추출 문제(ELK)를 다룹니다. 인과적 영향 다이어그램(CIDs)을 사용하여 이 문제를 형식적으로 정의하고, 관찰 가능한 변수와 잠재 변수를 구분합니다. 또한, 에이전트가 정직하게 답변하도록 유도하는 훈련 전략의 한계에 대한 불가능성 정리(impossibility theorem)를 증명했습니다.
PROJECTMEM: AI 코딩 에이전트를 위한 로컬 우선, 이벤트 소스 기반 메모리 및 판단 계층
AI 코딩 에이전트가 겪는 상태 비저장(stateless) 문제를 해결하기 위해, 오픈소스 로컬 우선 메모리 및 판단 계층인 projectmem을 소개합니다. 이 시스템은 개발 과정을 불변의 이벤트 로그로 기록하고, 이를 압축적인 요약으로 AI 모델 컨텍스트에 제공하여 에이전트의 기억력을 강화합니다. 또한, 과거 실패를 방지하는 결정론적 사전 행동 게이트 기능을 추가했습니다.
Nonslop: 인간-AI 협업 작문을 위한 게임화된 실험
본 연구는 게임화된 작문 실험을 통해 인간이 AI 제안을 수용하는 패턴과 창의적 자율성 유지 여부를 탐구합니다. 참가자들은 AI가 생성한 단어 제안을 받으면서도, 시스템은 사용자가 AI 도움을 받는 것을 명시적으로 금지하여 진정한 선호도를 유도했습니다. 이를 통해 인간-AI 상호작용에 영향을 미치는 요인들을 분석하고자 합니다.
MSUE: 다중 모드 축구 이해 전문가
본 논문은 2026 SoccerNet VQA Challenge 해결책으로 MSUE라는 다중 전문가 질의응답 아키텍처를 제안합니다. 이 시스템은 LLM을 활용하여 질문을 텍스트, 이미지, 비디오 등 여러 전문 모델에 동적으로 분배하고 협력하게 합니다. 이를 통해 높은 정확도를 달성하며 벤치마크에서 우수한 성능을 입증했습니다.
형태학적 격차 해소: 의도 조건부 미세 조정을 통한 VLA 모델의 정교한 조작 적응
본 논문은 로봇 조작 분야에서 VLA(Vision-Language-Action) 모델이 낮은 자유도 그리퍼에 국한되는 형태학적 격차 문제를 해결하기 위해 InDex라는 새로운 적응 프레임워크를 제안합니다. 이 방법은 기존의 1-DoF 출력을 가상 의도 프록시로 재활용하여, 두 단계 학습 아키텍처를 통해 다지 엔드 이펙터의 정교한 미세 조작을 데이터 효율적으로 수행할 수 있게 합니다.
책임감 있게 비준수적인 기계에 대한 연구
본 논문은 사용자 요청을 항상 준수하지 않을 수 있는 자율 지능형 에이전트 설계 문제를 다룹니다. 기계의 비준수성(non-compliance)이 다양한 형태로 나타남을 주장하며, 책임감 있게 이러한 비준수성을 구현하는 방법을 제시합니다.
Architect-Ant: 건축 평면도의 편집 가능한 자동 가구 배치
Architect-Ant는 건축 평면도에 가구를 자동으로 배치하는 새로운 프레임워크를 제안합니다. AntPlan-270 데이터셋과 도메인 특화 언어(DSL)를 활용하여, 건축적 제약 조건을 준수하면서도 편집 가능한 가구 레이아웃을 생성합니다.
이 피드 구독하기
본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.