© 2026 Molayo

Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

arXiv cs.AI 2012건필터 해제

MoEIoU: 전문가 혼합 (Mixture of Experts) 방식을 통한 경계 상자 회귀 (Bounding-Box Regression)의

객체 탐지의 정밀도를 높이기 위해 MoE(Mixture-of-Experts) 방식을 적용한 새로운 경계 상자 회귀 손실 함수인 MoEIoU를 제안합니다. 학습 단계에 따라 위치, 형태, 중첩 오류를 적응적으로 조절하여 기존 IoU 기반 손실 함수보다 빠른 수렴과 높은 정확도를 달성했습니다.

강화학습 (RL) 일반화 성능 평가를 위한 인증서 가이드 방식

강화학습(RL) 알고리즘의 미학습 작업에 대한 일반화 성능을 평가하기 위한 논리 기반 프레임워크를 제안합니다. 신경 인증서 함수를 통해 생성된 궤적을 검증함으로써 RL 알고리즘의 일반화 능력을 정량적으로 측정하고 입증합니다.

단서에서 지평선까지: 궤적 예측을 위한 동적 위험 지평선 프로파일링 (Dynamic Risk Horizon Profiling)

자율 주행의 안전성을 높이기 위해 위험의 미래 진화와 불확실성을 고려한 '위험 지평선 프로파일링(RHP)' 모듈을 제안합니다. 연속적이고 학습 가능한 포텐셜 필드 모델을 통해 주변 객체의 시공간적 위험 분포를 프로파일링하여 더욱 정확한 궤적 예측을 지원합니다.

도시 인지(Urban Perception)를 위한 시각-언어 모델(VLM) 벤치마크는 신뢰성을 고려하고 협상 가능해야 한다

도시 인지 작업을 위한 시각-언어 모델(VLM) 벤치마크가 인간의 판단 불일치와 기권을 반영해야 한다고 주장하는 연구입니다. 몬트리올 거리 장면 데이터를 통해 모델의 일치도가 인간의 신뢰도와 상관관계가 있음을 입증했습니다.

작업 다양성은 체계적인 전이를 생성하지만 지속적 강화학습을 저해한다

작업 다양성이 지속적 강화학습(Continual RL) 에이전트의 적응력에 미치는 영향을 분석한 연구입니다. 새로운 벤치마크 Banyan을 통해 작업 다양성이 단기적인 전이 학습에는 도움이 되지만, 장기적으로는 성능 정체와 망각을 초래함을 밝힙니다.

Waves 속으로의 다이빙: EEG 기반 피험자 간 감정 디코딩을 위한 Morlet Spectral Transformer

EEG 기반 피험자 간 감정 인식을 위해 Morlet Spectral Transformer(MST)를 제안합니다. MST는 Morlet 웨이브릿 토큰화와 주파수 특화 공간 투영을 통해 노이즈가 많은 뇌파 신호에서 정교한 시간-주파수 표현을 추출합니다.

Ryze: 생물 의학 논문으로부터의 증거 강화 데이터 합성

Ryze는 생물 의학 논문의 시각적 요소와 텍스트를 결합하여 증거가 강화된 학습 데이터를 자동으로 합성하는 시스템입니다. 이를 통해 구축된 BioVLM-8B 모델은 기존 모델 대비 높은 정확도를 기록하며 성능을 입증했습니다.

동적 희소성을 활용한 메모리 효율적 LLM 학습: 안정성에서 실질적 스케일링까지

동적 희소 학습(DST) 시 발생하는 LLM의 최적화 불안정성 문제를 해결하기 위한 SMET 프레임워크를 제안합니다. 옵티마이저 웜업과 밀도 인식 학습률 스케일링을 통해 손실 급증을 방지하고 메모리 효율성을 극대화합니다.

CV-Arena: 인간-AI 협업 선호도를 활용한 지시 기반 컴퓨터 비전 문제 해결을 위한 오픈 벤치마크

지시 기반 컴퓨터 비전 문제 해결 능력을 평가하기 위한 오픈 벤치마크 CV-Arena를 제안합니다. 인간과 AI의 협업을 통해 고품질 선호도를 측정하는 Active Elo 프로토콜과 에이전트 모델 CV-Agent를 함께 소개합니다.

개방형 에이전트 기술 생태계에서의 보안 위험 탐지 및 검증 벤치마킹

개방형 에이전트 플랫폼의 공급망 위험을 탐지하기 위한 2단계 보안 심사 벤치마크인 SkillVetBench를 제안합니다. 의미론적 심사와 샌드박스 기반의 런타임 검증을 결합하여, 기존 정적 방식이 놓치기 쉬운 악성 기술을 효과적으로 식별합니다.

Lodestar: 온라인 학습 기반의 LLM 추론 라우터

Lodestar는 분산 GPU 클러스터에서 LLM 추론 효율을 극대화하기 위한 온라인 학습 기반의 요청 라우팅 시스템입니다. 실시간 인스턴스 상태와 요청 특성을 학습하여 TTFT(첫 토큰 생성 시간)를 최소화하며, 기존 vLLM 서빙 스택과 호환됩니다.

설명 가능한 심층 강화학습을 통한 난류 항력 감소를 위한 에너지 효율적 제어 전략 규명

다중 에이전트 심층 강화학습(MARL)과 설명 가능한 심층 학습(XDL)을 결합하여 난류 항력을 효과적으로 감소시키는 제어 전략을 제안합니다. SHAP 기여도를 활용한 보상 설계가 에너지 효율성을 극대화하며, 기존 방식 대비 항력 감소와 에너지 절감 성능을 크게 향상시켰습니다.

부분 정보 분해(Partial Information Decomposition)를 통한 멀티모달 언어 모델의 모달리티 상호작용 이해 연구

본 연구는 부분 정보 분해(PID) 프레임워크를 통해 멀티모달 언어 모델(MLLM) 내 모달리티 간의 고유, 중복, 시너지 기여도를 분석합니다. 이를 통해 작업 유형별 모달리티 의존성을 파악하고, Sensory PID를 통해 옴니모달 모델의 정보 융합 특성을 규명합니다.

SS-ZKR: 프라이버시 보존형 멀티 에이전트 협업을 위한 공간-의미론적 영지식 라우팅

SS-ZKR은 멀티 에이전트 시스템(MAS)에서 데이터 프라이버시를 보호하며 의미론적 라우팅을 수행하는 새로운 프로토콜을 제안합니다. 영지식 증명(ZKP)과 차분 프라이버시를 결합하여 라우팅 중개자가 페이로드를 복호화하지 않고도 규제 준수 환경에서 에이전트 간 협업을 지원합니다.

재앙적 상태가 존재하는 MDP에서 Bellman 최적성을 통한 전망 이론 (Prospect-Theory) 행동 연구

재앙적 상태가 포함된 MDP에서 Bellman 최적성이 어떻게 전망 이론(Prospect Theory)과 유사한 행동을 유발하는지 연구합니다. 연구 결과, 표준 최적 제어 메커니즘만으로도 S자형 가치 함수, 손실 민감도, 반사 효과와 같은 특징이 자연스럽게 발생함을 입증했습니다.

다중 시점 참조 분할(Multi-temporal Referring Segmentation)을 위한 오픈 소스 벤치마크 및 베이스라인

다중 시점 이미지에서 언어 지시사항에 따라 시간적 변화를 분할하는 새로운 작업인 MTRS를 제안합니다. 이를 위해 최초의 벤치마크인 MTRefSeg-21K와 2단계 학습 전략을 사용하는 MTRefSeg-R1 프레임워크를 선보입니다.

교통 시스템 관리 및 운영에서의 대규모 언어 모델(LLM): 텍스트 추론에서 멀티모달(Multi-modal) 의사결정 지원까지

교통 시스템 관리 및 운영(TSMO) 분야에서 LLM과 멀티모달 LLM(MM-LLM)의 활용 가능성을 검토한 조사 논문입니다. 다양한 센서와 텍스트, 시각 데이터를 통합하여 의사결정을 지원하는 메커니즘과 현재의 기술적 과제를 분석합니다.

잠재적 학습(Subliminal Learning)은 스티어링 벡터 증류(Steering Vector Distillation)이다

잠재적 학습(Subliminal Learning)이 교사 모델의 스티어링 벡터를 학생 모델로 전달하는 '스티어링 벡터 증류' 과정임을 밝힌 연구입니다. 의미론적 관련성이 없는 데이터가 어떻게 특정 특성을 전달하는지 활성화 값의 관점에서 분석했습니다.

태스크 불가지론적 방식을 넘어: 통신 효율적인 멀티태스크 MoE 추론을 위한 태스크 인지형 그룹화

MoE 모델의 분산 추론 시 발생하는 GPU 간 통신 비용을 줄이기 위해 태스크 인지형 그룹화(TACG) 방식을 제안합니다. 태스크별로 다른 전문가 활성화 패턴을 반영하여 전문가를 배치함으로써 통신 효율을 높이고 부하 불균형을 완화합니다.

적층된 이중층 재료의 물성 예측: 멀티모달 학습 접근 방식

이중층 2D 재료 적층 시 발생하는 새로운 물성을 예측하기 위한 새로운 멀티모달 학습 접근 방식을 제안합니다. 실험을 통해 기존 베이스라인 방법보다 효과적이고 효율적임을 입증하였으며, 재료 과학 분야의 AI 활용 가능성을 확장합니다.

이 피드 구독하기

RSSFeedly, Inoreader 등으로 구독

API/api/search?q=검색어

AIllms.txt로 AI 크롤링 가이드

본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.