© 2026 Molayo

Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

arXiv cs.AI 2012건필터 해제

어텐션 확장: 어텐션 증강 문맥화 임베딩을 통한 긴 문서에서의 핵심구 추출 성능 향상

긴 문서의 핵심구 추출(KPE) 성능을 높이기 위해 사전 학습된 단어 임베딩을 활용한 '어텐션 확장' 메커니즘을 제안합니다. 이 방식은 계산 비용이 높은 긴 문맥 LLM 대신, 주변 문맥 외 정보를 활용해 PLM의 문맥 범위를 효율적으로 확장합니다.

EEG 감정 인식을 위한 시공간적 특징 학습용 Transformer 기반 모델

EEG 신호의 시공간적 특징을 효과적으로 학습하기 위한 Transformer 기반 모델인 EEG-TransNet을 제안합니다. ResNet, 웨이블릿 기반 노이즈 제거, 로컬 셀프 어텐션 및 FAST 모듈을 통해 감정 인식 성능과 강건성을 극대화했습니다.

Spatial-Omni: FOA 인코딩을 통한 멀티모달 LLM의 공간 오디오 이해 통합

Spatial-Omni는 기존 Omni LLM의 오디오 인코더를 수정하지 않고 FOA 인코딩을 통해 공간 오디오 이해 능력을 통합하는 경량화된 방법론을 제안합니다. 이를 위해 대규모 공간 오디오 데이터셋인 SO-Dataset과 성능 평가를 위한 SO-Bench를 구축하여 모델의 공간 추론 능력을 입증했습니다.

커리큘럼 선수 지식 그래프를 활용한 대화형 AI 상호작용에서의 지식 격차 탐지

GPT-4로 추출한 선수 지식 그래프를 활용하여 학생의 질문을 커리큘럼 주제로 자동 매핑하는 파이프라인을 제안합니다. 실험 결과, 질문 분류가 실제 학습 난이도와 높은 상관관계를 보이며 지식 격차를 탐지하는 유효한 도구임을 입증했습니다.

사고의 사슬(Chain of Thought)이 더 잘 알고 있을 때: 다회차 추론 모델의 실패 모드

다회차 추론 모델의 숨겨진 실패 모드를 분석하기 위해 'CoT-Output 2x2 안전 매트릭스'를 제안합니다. 내부 추론과 외부 출력 간의 불일치를 추적하여 정렬 속임 및 문맥 주입 실패와 같은 취약점을 규명합니다.

Arbiter Agent: 창발적 정렬 불일치(Emergent Misalignment)를 탐지하기 위한 다중 에이전트 대화의 지속적 모니터링

다중 에이전트 시스템에서 발생하는 창발적 정렬 불일치를 실시간으로 탐지하는 Arbiter 에이전트를 소개합니다. Arbiter는 제한된 예산 내에서 대화를 모니터링하며, 능동적인 조사와 질문을 통해 정렬되지 않은 에이전트를 식별합니다.

안전한 LLM 에이전트를 향하여: 위협 표면, 공격, 방어 및 평가

LLM 에이전트의 보안 위협을 체계적으로 모델링하기 위해 247편의 논문을 분석한 라이프사이클 기반 프레임워크를 제안합니다. 프롬프트 인젝션과 같은 기존 위협 외에도 상태 손상 및 멀티 에이전트 전파와 같은 신흥 위험을 식별하고 대응 방안을 제시합니다.

AutoPDE: 명시적으로 표현된 솔버 전략을 통한 신뢰할 수 있는 에이전트 기반 PDE 해결

AutoPDE는 편미분 방정식(PDE) 해결을 위해 솔버 전략을 명시적 객체로 관리하는 에이전트 프레임워크입니다. PDE 분석, 수치 방법 선택, 적응형 튜닝의 3단계 과정을 통해 수치적 안정성과 신뢰성을 확보합니다. 실험 결과 기존 베이스라인 대비 14.2%p 향상된 성능을 입증했습니다.

보안 중심 의사결정 지원 시스템 강화를 위한 베이지안 네트워크 (Bayesian Network) 접근 방식

이기종 스택 환경에서 보안 도구 선택을 돕는 베이지안 네트워크 기반 의사결정 지원 시스템(DSS)을 제안합니다. 사용자의 보안 요구사항을 포착하여 최적의 보안 메커니즘을 추론하는 확장 가능한 프레임워크를 다룹니다.

READER: 추출된 표현을 통한 강건한 증거 기반 저자 디코딩 (Robust Evidence-based Authorship Decoding

블랙박스 LLM 응답의 출처를 식별하기 위한 경량 프레임워크인 READER를 제안합니다. 프록시 활성화 공간과 베이지안 증거 축적 방식을 통해, 비정의 프롬프트 환경에서도 모델별 저자 흔적을 효과적으로 디코딩합니다.

벡터화(Vectorization)와 캐싱(Caching)을 통한 NeurASP 가속화

NeurASP 프레임워크의 계산 효율성을 높이기 위해 벡터화, 배치 처리, 캐싱 기술을 도입한 연구입니다. 미분 불가능한 ASP 구성 요소로 인한 속도 저하 문제를 해결하여 기존 대비 수십 배의 성능 향상을 달성했습니다.

Dep-LLM: 신뢰할 수 있는 LLM 추론을 통한 증거 기반 구조적 다요인 분석 기반의 학습이 필요 없는 우울증 진단

Dep-LLM은 추가 학습 없이 동결된 LLM을 활용하여 임상 인터뷰에서 우울증을 진단하는 새로운 프레임워크입니다. CoT 기반의 다요인 분석과 토큰 엔트로피를 이용한 신뢰도 조절을 통해 긴 문맥의 복잡한 단서를 효과적으로 처리합니다.

엄격한 단계별 검증을 통한 연구 수준의 수학 증명 평가

LLM의 수학적 증명 검증 시 발생하는 환각 문제를 해결하기 위해 단계별 검증(Step-level verification) 프레임워크를 제안합니다. 전역 평가의 한계를 극복하고 논리적 결함을 정밀하게 식별하며, 에이전트의 추론 능력을 강화하는 방안을 제시합니다.

합성 데이터를 활용한 사전 학습을 통한 ECG 분류 성능 향상

의료 데이터 부족 문제를 해결하기 위해 도메인 지식 기반의 합성 ECG 데이터를 활용한 사전 학습 연구를 소개합니다. 가우시안 구성 알고리즘으로 생성된 합성 데이터가 실제 데이터셋의 규모가 작을 때 분류 성능을 유의미하게 향상시킴을 입증했습니다.

Earth-OneVision: 원격 탐사 멀티모달 거대 언어 모델을 더 많은 센서 모달리티와 작업으로 확장하기

Earth-OneVision은 6가지 센서 모달리티와 9가지 작업을 통합한 2B 규모의 원격 탐사 멀티모달 거대 언어 모델입니다. 세 가지 전용 메커니즘을 통해 시각-언어 정렬 및 공간 출력 통합 문제를 해결하며, 기존 대규모 모델과 대등하거나 이를 능가하는 성능을 보여줍니다.

Moonshine: 추측 생성을 중심으로 하는 자율적 수학 연구 에이전트

Moonshine은 수학적 추측을 생성하고 이론적 프레임워크를 구축하는 자율 연구 에이전트입니다. Jacobian 추측을 사례로 Neural Jacobian Conjecture(NJC)를 공식화하고, GPT-5.5-pro와 DeepSeek-V4-pro를 활용해 특정 조건에서의 증명을 성공적으로 수행했습니다.

API를 넘어: 물리적 도구 사용에 있어서 MLLM의 한계 탐색

MLLM의 물리적 도구 사용 능력을 평가하기 위한 최초의 벤치마크인 PhysTool-Bench를 소개합니다. 실험 결과, 최신 모델들도 도구 인식과 작업 계획 단계에서 심각한 한계를 보이며 기능적 상식의 부족을 드러냈습니다.

K-Forcing: Push-Forward Language Modeling을 통한 공동 Next-K-Token 디코딩

K-Forcing은 기존 자기회귀(AR) 모델의 메모리 대역폭 제한 문제를 해결하기 위해 제안된 Push-Forward 언어 모델링 패러다임입니다. 단 한 번의 순전파로 여러 미래 토큰을 동시에 생성하여 고부하 배치 서빙 환경에서 추론 속도를 획기적으로 높입니다.

광 네트워크에서의 제로 데이 이상 탐지 및 분류를 위한 통합 Siamese 학습 프레임워크

광 네트워크 환경에서 제로 데이 이상 탐지와 원샷 분류를 통합하는 Siamese 신경망 프레임워크를 제안합니다. 이 모델은 재학습 없이도 미지의 이상 유형에 대해 99% 이상의 높은 정확도와 즉각적인 적응성을 보여줍니다.

Masked Diffusion 언어 모델을 위한 어텐션 할인 적응형 샘플러 (Attention-Discounted Adaptive

Masked Diffusion 언어 모델의 병렬 디코딩 품질을 개선하기 위한 새로운 훈련 불필요 샘플러인 ADAS를 제안합니다. ADAS는 어텐션 점수를 소프트 마진 페널티로 활용하여 토큰 간 상호작용을 고려한 재순위화를 수행합니다. 실험 결과, 기존 샘플러 대비 낮은 NFE 환경에서 성능을 크게 향상시키면서도 오버헤드는 최소화했습니다.

이 피드 구독하기

RSSFeedly, Inoreader 등으로 구독

API/api/search?q=검색어

AIllms.txt로 AI 크롤링 가이드

본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.