Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

arXiv cs.AI 2012건필터 해제

Wasserstein 공간 내에서 부드럽게 변화하는 분포를 위한 시공간 미니맥스 속도 (A Temporal Spatial Minimax

Wasserstein 공간 내에서 부드럽게 변화하는 분포의 미래 값을 추정할 때 발생하는 시공간 미니맥스 속도를 연구합니다. 시간-공간 축소 기법을 통해 새로운 하한을 도출하였으며, 이는 공간 추정의 저주와 시간적 외삽 비용 사이를 보간합니다.

6월 8일0

arXiv논문

CULTURESCORE: 비디오 생성 모델의 문화적 충실도 평가

비디오 생성 모델의 문화적 충실도를 평가하기 위한 새로운 프레임워크인 CultureScore를 제안합니다. 기존 지표가 시각적 품질에만 치중된 한계를 극복하기 위해 정체성, 맥락, 행동의 세 가지 차원으로 평가를 세분화했습니다.

6월 8일0

arXiv논문

데이터가 부족한 상황에서 자동 국소 피질 이형성증(FCD) 탐지에 합성 병변 MRI 영상이 미치는 영향

데이터 부족 문제를 해결하기 위해 합성 MRI 영상을 활용한 국소 피질 이형성증(FCD) 자동 탐지 연구를 수행했습니다. 생성 네트워크를 통해 만든 합성 데이터는 실제 영상과 구별하기 어려울 정도로 사실적이었으며, 모델의 민감도와 신뢰도를 향상시키는 데 기여했습니다.

6월 8일0

arXiv논문

야생에서의 유사분열 탐지: MIDOG 2025 챌린지에서의 다중 종양 및 문맥 인식 일반화

MIDOG 2025 챌린지는 실제 임상 환경의 다양성에 대응하는 유사분열 탐지 모델의 강건성을 평가합니다. 12가지 종양 유형과 다양한 스캐닝 플랫폼을 포함한 데이터셋을 통해 기존 모델의 성능 한계와 사각지대를 분석했습니다.

6월 8일0

arXiv논문

보고, 기억하고, 추론하기: MLLM을 통한 인간 관점의 비디오 이해

본 연구는 MLLM을 활용한 비디오 이해를 '보고, 기억하고, 추론하기'라는 인간 중심의 세 가지 관점으로 체계화하여 제시합니다. 비디오 모델의 지각, 메모리, 추론 과정을 분석하는 통합 구조를 통해 향후 비디오 지능 연구의 방향성을 제안합니다.

6월 8일0

arXiv논문

Socratic-SWE: 실행 추적 기반 에이전트 기술을 통한 자기 진화형 코딩 에이전트

Socratic-SWE는 에이전트의 과거 해결 추적을 활용하여 스스로 진화하는 폐쇄 루프 프레임워크를 제안합니다. 실패 사례와 수정 패턴을 구조화된 기술로 증류하여 타겟팅된 작업을 생성하고, 이를 통해 SWE-bench 등 주요 벤치마크에서 성능을 지속적으로 향상시킵니다.

6월 8일0

arXiv논문

진정한 연구자처럼 행동하기: 프론티어 LLM 및 연구 생애 주기 내 에이전트 하네스 평가를 위한 벤치마크 제품군

에이전트가 실제 연구자의 전문성과 추론 능력을 얼마나 모방할 수 있는지 평가하는 AARR 벤치마크 시리즈를 제안합니다. 첫 번째 벤치마크인 AARRI-Bench 실험 결과, 최상위 모델 구성도 인간 연구자의 미묘한 세부 사항을 놓치는 한계를 보였습니다.

6월 8일0

arXiv논문

장기 컨텍스트 자율 주행을 위한 계획 정렬형 토큰 압축 (Planning-aligned Token Compression for

자율 주행 비전-액션 모델의 긴 컨텍스트 처리를 위해 계획 의도에 정렬된 토큰 압축 프레임워크인 COMPACT-VA를 제안합니다. VQ-VAE를 활용해 과거 궤적과 계획 의도를 결합하여 압축함으로써, 정보 손실을 최소화하고 계산 효율성을 극대화합니다.

6월 8일0

arXiv논문

PaperFlow: 일일 논문 스트림 전반에 걸친 프로파일링, 추천 및 적응

PaperFlow는 사용자의 변화하는 관심사를 반영하여 일일 논문 스트림을 프로파일링, 추천, 적응시키는 새로운 프레임워크를 제안합니다. 종단적 사용자-일 벤치마크를 통해 기존 베이스라인보다 높은 행동 정렬과 인간 평가 점수를 입증했습니다.

6월 8일0

arXiv논문

숨겨진 표현 스티어링(Steering) 및 희소 오토인코더(SAE)를 통한 Whisper의 환각(Hallucination) 탐지 및 완화

Whisper 모델의 환각 현상을 탐지하고 완화하기 위해 내부 표현과 희소 오토인코더(SAE)를 활용하는 연구를 소개합니다. SAE 기반 스티어링 전략을 통해 음성 인식 성능 저하를 최소화하면서도 환각 발생률을 획기적으로 낮추는 성과를 거두었습니다.

6월 8일0

arXiv논문

AI 에이전트가 지식 노동을 재편하는 방식: 자율성, 효율성, 그리고 범위

Perplexity의 데이터를 통해 AI 에이전트가 지식 노동을 어떻게 재편하는지 분석한 연구입니다. 자율적 에이전트(Computer)가 단순 검색(Search)보다 작업 수행 시간과 비용을 획기적으로 줄이고, 고차원적 업무 수행을 가능하게 함을 입증했습니다.

6월 8일0

arXiv논문

MemDreamer: 계층적 그래프 메모리 및 에이전트 기반 검색 메커니즘을 통한 긴 비디오 이해를 위한 인지 및 추론의 분리

MemDreamer는 긴 비디오 이해를 위해 인지와 추론을 분리한 새로운 프레임워크를 제안합니다. 계층적 그래프 메모리와 에이전트 기반 검색을 통해 토큰 폭발 문제를 해결하며, 주요 벤치마크에서 SOTA 성능을 달성했습니다.

6월 8일0

arXiv논문

자율주행 자동차 시대의 ISO 26262 재구상: 전이성(Transferability)과 예측 가능성(Predictability)을 통한 제어

자율주행 자동차(AV) 환경에 맞춰 ISO 26262 기능 안전 표준을 재구성하는 연구를 제안합니다. 기존의 제어 가능성 개념을 전이성과 예측 가능성이라는 두 가지 측정 가능한 지표로 세분화하여 안전성을 정량화합니다.

6월 8일0

arXiv논문

주사위 놀이를 할 때 LLM은 얼마나 신뢰할 수 있는가?

이 연구는 LLM의 이산 확률 문제 해결 능력을 벤치마킹하여 확률적 추론의 한계를 조사합니다. 표준 문제에서는 높은 정확도를 보이지만, 반직관적인 문제나 변형된 문제에서는 성능이 급격히 하락함을 확인했습니다.

6월 8일0

arXiv논문

OneReason 기술 보고서

생성형 추천 모델의 추론 능력 한계를 극복하기 위한 OneReason 기술 보고서입니다. 아이템 토큰의 언어적 의미를 파악하는 지각(perception)과 사용자 행동을 재구성하는 인지(cognition) 능력을 결합하여 효과적인 CoT를 구현합니다.

6월 5일0

arXiv논문

무손실 픽셀 수준 이미지 전송을 위한 확산 언어 모델의 적응

무손실 픽셀 수준 이미지 전송을 위해 이산 확산 모델 기반의 DDM-SSCC 프레임워크를 제안합니다. 확산 언어 모델을 픽셀 토큰 복원에 적응시키고 양방향 어텐션과 역 산술 코딩을 결합하여 정확한 복구 성능을 높였습니다.

6월 5일0

arXiv논문

DAST: O-RAN의 교차 인터페이스 이상 탐지를 위한 VLM-LLM 프레임워크

O-RAN 환경의 복잡한 보안 위협을 탐지하기 위해 VLM과 LLM을 결합한 제로샷 멀티 에이전트 프레임워크 DAST를 제안합니다. 시계열 데이터를 시각화하고 도메인 지식을 활용하여 서비스 거부 및 성능 저하 공격을 효과적으로 식별합니다.

6월 5일0

arXiv논문

ToolChoiceConfusion: 신뢰할 수 있는 LLM 에이전트를 위한 인과적 최소 도구 필터링

LLM 에이전트의 도구 선택 시 발생하는 잘못된 호출과 비용 문제를 해결하기 위해 인과적 최소 도구 필터링(CMTF) 방법론을 제안합니다. CMTF는 전제 조건-효과 계약을 활용하여 현재 단계에 꼭 필요한 최소한의 도구만을 노출함으로써 효율성을 극대화합니다.

6월 5일0

arXiv논문

TRACE: 멀티모달 시계열 파운데이션 모델을 위한 시계열 조건부 추정

TRACE는 멀티모달 시계열 파운데이션 모델을 위한 새로운 조건부 추정 패러다임을 제안합니다. 시간적 정렬 불량과 모달리티 누락 문제를 해결하기 위해 보조 모달리티로부터 타겟 모달리티를 체계적으로 추론합니다.

6월 5일0

arXiv논문

LLM은 학습 데이터를 유출할 수 있는가, 하지만 정말로 그러고 싶어 하는가? LLM 암기 현상에 대한 성향 인식 평가

LLM의 학습 데이터 암기 현상을 평가하기 위해 성향 인식 프레임워크인 PropMe와 추적 파이프라인 SimpleTrace를 제안합니다. 연구 결과, 모델은 강제적인 공격 상황에서는 데이터를 유출할 수 있으나 일반적인 상황에서의 유출 성향은 낮음을 확인했습니다.

6월 5일0

이 피드 구독하기

RSSFeedly, Inoreader 등으로 구독

API/api/search?q=검색어

AIllms.txt로 AI 크롤링 가이드