Insights
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
arXiv cs.AI 2159건필터 해제
시간적 개념 드리프트(Temporal Concept Drift) 하에서의 적대적 취약성: Android 악성코드 탐지에 대한 종단적 연구
Android 악성코드 탐지 모델의 시간적 개념 드리프트(Temporal Concept Drift)에 따른 적대적 취약성을 종단적으로 분석한 연구입니다. 10년 치 데이터를 바탕으로 데이터 분포 변화가 모델의 강건성에 미치는 영향을 정량화하고 새로운 평가 지표를 제안합니다.
DualMem: 개방형 세계 객체 탐지(Open-World Object Detection)에서 보정된 미지 객체 스트림 필터링을 위한 객체성
개방형 세계 객체 탐지(OWOD)에서 미지 객체 예측 스트림이 배경 오탐으로 인해 심하게 오염되는 문제를 분석하고, 이를 해결하기 위한 DualMem을 제안합니다. DualMem은 SigLIP 특징 공간에서 비모수적 우도비 검정과 메모리 메커니즘을 사용하여 배경 오탐을 획기적으로 줄입니다.
노이즈를 통한 학습: 잠재적 학습(Subliminal Learning)이 작동하는 이유와 실패하는 시점
인공 신경망에서 작업과 무관한 노이즈를 통해 지식이 전달되는 '잠재적 학습(Subliminal Learning)'의 메커니즘을 분석합니다. 본 연구는 초기화 상태보다 출력 헤드의 호환성이 잠재적 학습의 핵심임을 입증하며, 이를 이론적으로 설명합니다.
PhotoFlow: 에이전트 기반 3D 가상 사진 촬영 미션
PhotoFlow는 3D 장면에서 언어적 의도에 따라 최적의 카메라 파라미터를 추론하고 사진을 렌더링하는 에이전트 프레임워크입니다. Director-Reviewer-Reflector 구조를 통해 3D 공간 이해와 미적 판단 능력을 결합하여 고품질의 가상 사진 촬영을 수행합니다.
너무 생성적이지도, 너무 판별적이지도 않게: 인간 정렬의 최적 지점
본 연구는 판별적 학습과 생성적 학습 사이의 균형이 인간의 시각적 인지와 어떻게 정렬되는지 분석합니다. JEM을 통해 두 학습 목표를 결합한 결과, 양 극단이 아닌 중간 지점에서 인간과 가장 유사한 시각적 표현이 나타남을 증명했습니다.
데이터가 아니라 인간이다: LLM의 지정학적 편향은 사후 학습(post-training)에서 발생하며 프롬프트 언어에 의해 증폭된다
LLM의 지정학적 편향이 사전 학습 데이터가 아닌 사후 학습(post-training) 과정에서 발생한다는 연구 결과입니다. 연구에 따르면 사후 학습 후 모델은 개발자의 국가나 지역적 관점으로 편향되며, 프롬프트 언어에 따라 이러한 편향이 증폭될 수 있습니다.
인과적 생성 모델링 (Causal Generative Modeling)을 위한 파운데이션 모델 (Foundation Models) 활용
본 논문은 파운데이션 모델을 활용하여 시각적 인과 추론을 수행하는 모듈형 프레임워크 FM-CGM을 제안합니다. 개념 추출, 조작, 반사실적 생성을 통해 제로샷 인과 발견과 개입을 가능하게 하며, CSG 메커니즘으로 의미론적 일관성을 유지합니다.
설득력 있고 서사적인 LLM 설명을 통한 인간의 의사결정
LLM이 생성하는 서사적 설명이 인간의 의사결정 성능에 미치는 영향을 분석한 연구입니다. 실험 결과, 설득력 있는 설명은 의사결정 정확도를 높이지 못하며 오히려 AI에 대한 과도한 의존도를 높이고 판단 능력을 저해할 수 있음을 발견했습니다.
PGT: MLLM의 시각적 접지(Visual Grounding) 성능 향상을 위한 절차적 생성 태스크
MLLM의 세밀한 시각적 이해를 돕기 위해 기하학적 도형을 활용한 절차적 생성 태스크(PGT) 프레임워크를 제안합니다. PGT는 시각적 접지 능력과 의미론적 지식을 분리하여 모델의 인지 결함을 진단하고 성능을 향상시킵니다.
SkillOpt: 자기 진화형 에이전트 기술을 위한 실행 전략
SkillOpt는 에이전트의 기술(skill)을 딥러닝 최적화 방식처럼 체계적으로 진화시키는 최초의 텍스트 공간 최적화 도구입니다. 별도의 추론 비용 추가 없이 편집 과정을 통해 기술 문서를 개선하며, 다양한 벤치마크와 모델에서 압도적인 성능 향상을 입증했습니다.
CHRONOS: 진화하는 데이터 마켓플레이스를 위한 시간 인지형 멀티 에이전트 협업 (Temporally-Aware Multi-Agent
CHRONOS는 시간적 지식 그래프 데이터 마켓플레이스의 문제를 해결하기 위한 3계층 멀티 에이전트 아키텍처를 제안합니다. neural-ODE를 통한 시간적 감쇠 적용, 변화점 기반 Shapley 가치 평가, 그리고 차분 프라이버시를 보장하는 EXP3-IX 알고리즘을 통해 데이터의 진화와 프라이버시 문제를 통합적으로 다룹니다.
효율적인 토큰 탐색: Visual Geometry Transformers를 위한 토큰 선택 가이드
Visual Geometry Transformers의 계산 효율성을 높이기 위해 토큰 수를 제한하는 2단계 프레임워크를 제안합니다. 프레임 간 및 프레임 내 선택 전략을 통해 성능 저하 없이 모델 속도를 85% 이상 가속화할 수 있습니다.
SPACENUM: VLM의 공간적 수치 이해 재고
본 연구는 VLM이 행동 크기나 공간 좌표와 같은 수치적 출력을 생성할 때 실제 공간적 지각에 근거하는지 분석합니다. SpaceNum 프레임워크를 통해 모델들이 수치와 공간 구조 간의 매핑에 실패하며, 무작위 추측에 가까운 성능을 보인다는 점을 밝혀냈습니다.
가공되지 않은 경험에서 기술 소비로: 모델 생성 에이전트 기술에 대한 체계적 연구
언어 에이전트의 기술 생애주기인 경험 생성, 기술 추출, 기술 소비를 아우르는 체계적인 연구를 제시합니다. 모델 생성 기술의 효용성과 부정적 전이 문제를 분석하고, 기술 품질을 향상시키기 위한 메타 기술을 제안합니다.
노이즈 채널로서의 LLM: 모델 용량과 스케일링 법칙에 대한 Shannon 관점
기존 스케일링 법칙이 설명하지 못하는 비단조적 성능 저하 현상을 Shannon-Hartley 정리를 통해 해석하는 새로운 이론적 프레임워크를 제안합니다. 모델 파라미터를 대역폭으로, 학습 토큰을 신호 전력으로 매핑하여 LLM의 근본적인 정보 전송 용량을 분석합니다.
AI 보증 (AI Assurance): 기업용 AI 시스템을 위한 포괄적 테스트 전략
기업용 AI 시스템의 확률적 특성으로 인해 발생하는 새로운 리스크를 관리하기 위한 포괄적인 보증 전략을 제시합니다. 리스크 감소 중심의 테스트, 평가 중심 개발(EDD), 그리고 AI 보증 피라미드 모델을 통해 신뢰할 수 있는 AI 운영 가이드를 제공합니다.
CVSearch: 고해상도 이미지 인식을 위한 인지적 시각 탐색을 통한 멀티모달 LLM 강화
CVSearch는 고해상도 이미지 인식 시 발생하는 커버리지와 효율성 간의 트레이드오프를 해결하기 위한 적응형 프레임워크입니다. '평가 후 탐색' 워크플로우를 통해 전역 정보 부족 시 전문가 보조 탐색과 의미 인식 스캐닝을 동적으로 스케줄링합니다.
하나의 정책, 무한한 NPC: 확장 가능한 게임 에이전트를 위한 페르소나 추적 가능 공유 강화학습 (RL) 정책
pcsp는 단일 강화학습(RL) 정책으로 수백 명의 NPC에게 고유한 페르소나를 부여하는 기술입니다. LLM 기반 방식보다 22배 빠른 추론 속도를 제공하며, UE5 환경에서도 실시간 성능을 입증했습니다.
MemAudit: 인과적 귀속(Causal Attribution) 및 구조적 이상 탐지(Structural Anomaly Detection)를
LLM 에이전트의 지속적 메모리에 주입된 악의적 기록을 탐지하기 위한 사후 인과적 감사 프레임워크 MemAudit을 제안합니다. 반사실적 영향력 점수와 메모리 일관성 그래프를 결합하여 유해한 행동의 원인이 되는 메모리를 식별합니다.
Any2Any: 휴머노이드 전신 추적을 위한 효율적인 교차 신체 구조 전이 (Cross-Embodiment Transfer)
Any2Any는 소량의 데이터와 연산만으로 사전 학습된 전신 추적(WBT) 모델을 새로운 휴머노이드 신체 구조로 효율적으로 전이하는 새로운 패러다임을 제안합니다. 운동학적 정렬과 PEFT를 결합하여 기존 지식을 보존하면서도 타겟 로봇에 빠르게 적응할 수 있습니다.
이 피드 구독하기
본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.