© 2026 Molayo

Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

arXiv cs.AI 2012건필터 해제

LiveStarPro: 계층적 메모리를 활용한 장기 스트림 대상의 선제적 스트리밍 비디오 이해

LiveStarPro는 장기 비디오 스트림을 효율적으로 이해하기 위해 설계된 새로운 라이브 스트리밍 어시스턴트입니다. SVeD, SCAM, TSHM이라는 세 가지 핵심 구성 요소를 통해 실시간 응답성과 장기 문맥 유지 능력을 혁신적으로 개선했습니다.

DecoSearch: Text-to-SQL을 위한 복잡도 인식 라우팅 및 계획 수준 수리 (Plan-Level Repair)

DecoSearch는 복잡한 Text-to-SQL 질의를 해결하기 위해 질문의 난이도에 따라 추론 경로를 라우팅하는 training-free 프레임워크입니다. 스키마 선택, 질문 분해, 계획 수준 수리 과정을 통해 효율적이고 정확한 SQL 생성을 지원합니다.

대화형 콘텐츠 워크플로우를 위한 Human-in-the-Loop 방식의 아틀라스 기반 3D 에셋 세그멘테이션 (Segmentation)

대화형 미디어와 게임, XR 워크플로우를 위해 3D 모델로부터 세그멘테이션된 2D 아틀라스를 생성하는 Human-in-the-loop 파이프라인을 제안합니다. SAM 2와 Label Studio를 활용하여 사용자가 직접 세그멘테이션을 제어하고 정교한 마스크를 생성할 수 있습니다.

MRI를 이용한 골반 장기의 고충실도 3D 기하학적 재구성: 딥러닝 (Deep Learning) 및 반복 최적화 (Iterative

MRI 데이터를 활용해 골반 장기의 고충실도 3D 기하학적 구조를 재구성하는 하이브리드 프레임워크를 제안합니다. 딥러닝의 빠른 예측 능력과 반복 최적화의 정밀함을 결합하여 기존 모델보다 우수한 기하학적 정확도와 메쉬 품질을 달성했습니다.

뉴로심볼릭 추론의 호모토피 유형론적 일반화

뉴로심볼릭(NeSy) 시스템의 한계를 극복하기 위해 호모토피 유형론(HoTT)을 도입한 새로운 추론 프레임워크를 제안합니다. 집합 대신 유형을 사용하여 이론의 대칭성과 증명의 수를 보존하며, 이를 통해 추론 지름길 문제를 해결하고 앙상블 모델보다 더 나은 보정 성능을 입증했습니다.

알츠하이머병 (Alzheimer's Disease) 내 멀티모달 바이오마커 (Multimodal Biomarkers)의 정량적 분석

알츠하이머병(AD)의 정밀한 진단을 위해 분자적, 구조적, 임상적 바이오마커를 통합하는 멀티모달 정량 분석 연구를 제시합니다. ADNI 데이터셋을 활용하여 각 바이오마커 간의 상호 정보량과 신경 퇴행 궤적을 분석함으로써 질병 모델링의 효율성을 높였습니다.

그래프 신경망 (GNN)의 구조적 보존과 논리적 표현력

본 논문은 그래프 신경망(GNN)의 구조적 선택과 논리적 형식주의 사이의 관계를 분석합니다. 임베딩, 단사 준동형, 준동형 하에서 보존되는 GNN 클래스의 논리적 표현력을 등급 양상 논리의 파편을 통해 확립합니다.

다국적 인력 전반의 AI 도입: 인사 관리(HR) 분야에서 생성형 AI (GenAI) 수용을 위한 사회기술적 조건

다국적 기업의 HR 분야 내 생성형 AI 도입 과정을 분석한 연구입니다. AI 시스템의 설계와 직원의 역할, 언어, 근속 연수 간의 적합성이 도입 성패를 결정하며, 신뢰 구축을 위한 검증 과정이 중요함을 밝힙니다.

MathVis-Fine: 점진적 의존성 가이드 학습을 통해 시각적 감독을 필요성에 맞춰 정렬하는 멀티모달 수학적 추론 방법론

MathVis-Fine은 멀티모달 수학적 추론 시 텍스트와 이미지 간의 복잡한 의존성을 정밀하게 모델링하는 새로운 프레임워크입니다. 시각적 의존성 등급을 활용한 데이터셋과 2단계 점진적 강화 학습을 통해 보상 편향을 줄이고 추론 정확도를 높입니다.

보행자 보행을 위한 제약 조건을 활용한 사회적 상호작용 정량화 학습

군중 속 보행자의 경로 예측을 위해 사회적 상호작용을 정량화하는 'Learn to Cluster' 방법론을 제안합니다. 확률적 잠재 변수 생성 모델을 통해 레이블 없이도 보행자 간 상호작용 패턴을 학습하고 예측 모델에 통합할 수 있습니다.

DiagFlowBench: 근거 기반 진단 대화에서 언어 모델이 절차 외 입력을 처리하는 방식에 대한 평가

근거 기반 진단 대화에서 언어 모델이 절차 외 입력을 처리하는 능력을 평가하는 새로운 벤치마크 DiagFlowBench를 소개합니다. 10개의 모델을 평가한 결과, 모델들이 사실을 꾸며내기보다 문맥에 부적절한 단계를 선택하는 취약점이 발견되었습니다.

PearlVLA: 잠재 공간에서의 점진적 체화된 행동-계획 정제 (Progressive Embodied Action-Plan

PearlVLA는 VLA 모델의 효율적인 행동 생성과 명시적 추론 사이의 트레이드오프를 해결하기 위해 제안된 프레임워크입니다. 숙고 과정을 VLM의 잠재 공간으로 이동시켜 지연 시간을 줄이면서도 정교한 계획 능력을 유지합니다.

PreAct: 반복되는 작업에서 더 빨라지는 컴퓨터 사용 에이전트

PreAct는 컴퓨터 사용 에이전트의 반복 작업을 가속화하기 위해 실행 과정을 상태 머신 프로그램으로 컴파일하는 기술입니다. 언어 모델 호출 없이 프로그램을 직접 재생함으로써 기존 대비 8.5~13배 빠른 속도를 구현하며, 화면 상태를 검증하여 안정성을 확보합니다.

추론 연산(Inference Compute)이 최첨단 LLM 평가에 미치는 영향

AI 평가 방식이 도구 사용 및 반복적 문제 해결을 포함하는 복잡한 과제로 진화하고 있습니다. 이에 따라 테스트 시점에 할당되는 추론 연산량(Inference Compute)이 모델 성능에 미치는 영향이 중요해지고 있습니다.

대규모 언어 모델(LLM)에서 작은 초기화의 중요성

본 연구는 LLM의 파라미터 초기화 규모가 모델의 용량과 추론 능력에 결정적인 영향을 미친다는 사실을 밝힙니다. 초기화 규모를 줄이면 사전 학습 성능이 개선되며, 파라미터가 저복잡도 구조에서 풍부한 표현으로 확장되는 독특한 발달 궤적을 보입니다.

Plug-and-Adapt: 사전 학습된 정렬 모델을 통한 즉각적인 멀티모달 상호참조 해결 (Multimodal Coreference

기존의 멀티모달 상호참조 해결(MCR) 방식이 가진 데이터셋 학습 의존성과 거대 모델(VLLM)의 높은 비용 문제를 해결하기 위한 'plug-and-adapt' 방법을 제안합니다. 사전 학습된 정렬 모델을 전략적으로 적응시켜 추가 학습 없이도 높은 성능을 내는 효율적인 접근법을 제시합니다.

회전에 따른 유사도 기반 위치 인코딩(Similarity-based Positional Encoding)의 강건성: 이론적 분석 및 실험적 검증

유사도 기반 위치 인코딩(simPE)의 회전 강건성을 이론적·실험적으로 분석한 연구입니다. simPE가 회전 불변은 아니지만, 특정 조건 하에서 회전 섭동에 대해 안정적임을 증명하고 다양한 데이터셋을 통해 기존 방식보다 우수한 성능을 입증했습니다.

광 네트워크를 위한 T-API 준수 ReAct 에이전트 루프: 범용 대 도메인 특화 도구 추상화

광 네트워크의 자율적 관리를 위해 T-API를 준수하는 ReAct 에이전트 루프를 제안합니다. 도메인 특화 도구를 활용할 경우 범용 도구 대비 토큰 사용량을 3배 절약하면서도 90%의 높은 정확도를 달성할 수 있음을 입증했습니다.

SegDINO: 효율적인 의료 영상 분할을 위해 DINO에 다중 스케일 구조를 도입함

SegDINO는 DINO 모델의 시각적 표현을 활용하여 효율적인 의료 영상 분할을 수행하는 프레임워크입니다. 무거운 디코더 대신 토큰 피라미드 적응(TPA)과 스케일 인지 디코딩(SAD)을 통해 연산 오버헤드를 줄이면서도 높은 성능을 구현했습니다.

전략적 논리를 위한 전략 합성의 신경-기호적 접근 방식

다중 에이전트 시스템(MAS)의 전략 합성을 위해 LLM과 모델 검사기를 결합한 신경-기호적 프레임워크를 제안합니다. LLM이 전략을 생성하고 표준 검사기가 이를 검증하는 '생성 및 인증' 구조를 통해 계산 비용을 줄이면서도 형식적 건전성을 유지합니다.

이 피드 구독하기

RSSFeedly, Inoreader 등으로 구독

API/api/search?q=검색어

AIllms.txt로 AI 크롤링 가이드

본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.