© 2026 Molayo

Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

arXiv cs.AI 2012건필터 해제

위치 기반 대 상 기호 기반 어텐션 헤드: 학습 역학, RoPE 기하학, 그리고 길이 일반화

Transformer 모델의 어텐션 헤드가 위치 기반 또는 기호 기반으로 학습되는 역학을 연구합니다. 숫자와 문자 작업의 구조적 차이에 따른 메커니즘을 분석하고, RoPE 기하학을 통해 긴 시퀀스에 대한 외삽 성능 차이를 규명합니다.

모호한 입력 상황에서 시각-언어 모델(VLMs)의 여성 재현 억제 현상

시각-언어 모델(VLMs)이 모호한 입력 상황에서 직업-성별 스테레오타입을 어떻게 출력하는지 분석한 연구입니다. 모델이 내부적으로는 여성 연관성을 인코딩하더라도, 출력 단계에서 남성 신호가 증폭되고 여성 신호가 억제되는 현상을 발견했습니다.

SPECTRA: 관련성 오라클(Relevance Oracles) 및 제어된 방해 요소 진단(Controlled Distractor

SPECTRA는 합성 텍스트 코퍼스와 검색 테스트 컬렉션을 생성하는 재현 가능한 프레임워크입니다. 인간의 평가를 보완하는 진단 도구로서, 대규모 데이터셋 구축 비용을 절감하고 검색 시스템의 확장성과 실패 모드를 효과적으로 테스트할 수 있습니다.

언어 모델은 구문론뿐만 아니라 구성 의미론(Constructional Semantics)을 학습하는가: Paired-Focus 구문에 대한

LLM이 희귀한 Paired-Focus 구문의 구성 의미론을 학습하는지 분석한 연구입니다. 새로운 데이터셋을 통해 모델 규모와 학습 역학을 테스트한 결과, 특정 규모의 오픈 소스 모델은 구문론보다 의미론을 나중에 습득하며 세상 지식과 상관관계가 있음을 발견했습니다.

Lumos-Nexus: 비디오 통합 모델을 위한 균질한 잠재 공간 기반의 효율적인 주파수 브릿징

Lumos-Nexus는 비디오 통합 모델의 훈련 효율성과 시각적 품질을 동시에 개선하는 새로운 프레임워크입니다. 2단계 설계를 통해 경량 생성기로 의미론적 제어를 학습한 뒤, 추론 시 UPFB 기술로 고용량 생성기의 성능을 점진적으로 활용합니다.

무엇이 가장 먼저 언마스킹되는가? 그래프-텍스트 생성(Graph-to-Text Generation)을 위한 확산 모델(Diffusion

그래프-텍스트 생성(Graph-to-Text)을 위한 마스크 확산 언어 모델(MDLM)의 생성 궤적을 분석한 연구입니다. MDLM이 엔티티를 우선 생성하는 특성을 발견하고, SFT의 실패 모드를 해결하기 위한 람다 스케일 구조적 디코딩 기법을 제안합니다.

상태 유지형 온라인 모니터링(Stateful Online Monitoring)을 통한 분산된 에이전트 공격 탐지

분산된 에이전트 공격을 탐지하기 위한 상태 유지형 온라인 모니터링 기술을 제안합니다. 기존 모니터가 놓치는 계정 간 분산된 유해 행위를 실시간 클러스터링으로 식별하여, 낮은 지연 시간으로 공격을 조기에 포착합니다.

LongTraceRL: 루브릭 보상(Rubric Rewards)을 활용한 검색 에이전트 궤적 기반의 장문 맥락 추론 학습

LongTraceRL은 장문 맥락 추론 능력을 향상시키기 위해 루브릭 보상(Rubric Rewards)을 활용한 새로운 강화학습 방법론을 제안합니다. 계층적 방해 요소를 포함한 도전적인 데이터셋과 엔티티 수준의 과정 감독을 통해 모델의 증거 기반 추론 성능을 극대화합니다.

TunerDiT: 다중 이벤트 비디오 생성을 위한 Diffusion Transformer의 훈련 없는 점진적 스티어링 (Progressive

TunerDiT는 추가 훈련 없이 Diffusion Transformer를 활용해 다중 이벤트 비디오를 생성하는 기술입니다. 이벤트 분할 마스킹과 프롬프트 융합을 통해 비디오 일관성과 이벤트 분리 사이의 조절 가능한 성능을 제공합니다.

관점의 선택: 문맥 의존적 논증에서의 전략적 관점 활성화

문맥에 따라 논증의 성패가 결정되는 CDAFs(Context-Dependent Argumentation Frameworks) 프레임워크를 제안합니다. 에이전트가 전략적 레버를 활용해 관점을 활성화함으로써 논증의 결과를 조절할 수 있음을 이론적으로 증명합니다.

온라인 금융 QA를 위한 데이터 중심 컴파일을 통한 수치적 환각(Numerical Hallucinations) 방지

금융 QA 분야에서 LLM의 수치적 환각 문제를 해결하기 위해 데이터 중심 추론 컴파일러(DCRC) 프레임워크를 제안합니다. 적대적 데이터 구축과 다단계 학습을 통해 검증 가능한 추론 프로그램을 생성하여 신뢰성을 높입니다.

STEP: 점진적 시계열 (Progressive Time Series)을 위한 구조적 임베딩 (Structured Embeddings) 학습

점진적 시계열 데이터의 해석 가능한 표현을 학습하기 위한 새로운 방법론인 STEP을 제안합니다. 자기지도 대조 학습을 통해 저차원 잠재 공간을 구축하며, 잠재 컴퍼스(θ, r)를 통해 상태 진행과 활성 모드를 명확히 구분합니다.

DRIFT: 파일럿 없는 6G 비지상 네트워크(NTN)를 향한 공동 채널 추정 및 예측

6G 비지상 네트워크(NTN) 환경에서 파일럿 오버헤드를 줄이기 위한 경량 채널 예측 프레임워크 DRIFT를 제안합니다. LEO 위성의 전력 제약을 고려하여 낮은 계산 복잡도로 정확한 채널 예측을 수행하며, 스펙트럼 효율을 최대 12% 향상시킵니다.

소형 시각-언어 모델(VLMs)을 활용한 시각 장애 및 저시력(BLV) 청중을 위한 큐레이터 가이드 기반 다국어 예술 작품 묘사에 관한 예비

시각 장애 및 저시력(BLV) 사용자를 위해 소형 시각-언어 모델(VLMs)을 활용한 다국어 예술 작품 묘사 연구를 수행했습니다. Qwen2.5-VL-3B-Instruct 모델과 LoRA 어댑터를 사용하여 독일어, 루마니아어, 세르비아어 환경에서의 묘사 품질을 비교 분석했습니다.

오분류된 이미지를 식별하기 위한 엔트로피 재고찰

훈련 역학을 활용하여 데이터셋 내 오분류된 샘플을 탐지하는 새로운 방법론인 SEI(signed entropy integral)를 제안합니다. 올바른 라벨은 엔트로피가 감소하지만 오분류된 샘플은 높은 엔트로피를 유지한다는 점을 이용하며, 의료 영상 분야에서 뛰어난 성능을 입증했습니다.

인스턴스 매칭의 재정의: 파놉틱 세그멘테이션 (Panoptic Segmentation) 평가를 위한 파트 인식 매칭 (Part-Aware

파놉틱 품질(PQ) 지표의 기존 일대일 매칭 한계를 극복하기 위해 세그먼트 매칭을 이분 할당 문제로 재구성한 연구입니다. IoU 임계값 0.5 미만에서의 다양한 매칭 전략을 체계화하고, 이를 파트 인식 세그멘테이션 및 생물 의학 데이터로 확장하는 프레임워크를 제안합니다.

SpecDB: 특징 중심 분해를 통한 LLM 생성 맞춤형 데이터베이스

SpecDB는 LLM을 활용하여 특정 워크로드에 최적화된 맞춤형 관계형 데이터베이스를 생성하는 시스템입니다. 기능 모듈을 분해하고 에이전트 기반 파이프라인을 통해 기존 DB 대비 코드 크기를 3% 수준으로 줄이면서도 유사한 성능을 구현했습니다.

교차 모델 국소 등거리 일관성을 통한 벡터 연결 (Vector Linking via Cross-Model Local Isometric

서로 다른 블랙박스 인코더가 생성한 임베딩 간의 객체 대응 관계를 복구하는 '벡터 연결(Vector Linking)' 기술을 제안합니다. 국소적 기하학적 일관성을 활용한 기하학적 임베딩 해싱 방식을 통해 소수의 앵커 데이터만으로도 정확한 연결이 가능함을 입증했습니다.

KnowledgeGain: 독자의 학습을 위한 과학 뉴스 생성 평가 및 최적화

독자의 지식 습득량을 측정하여 과학 뉴스의 품질을 평가하는 새로운 지표인 KnowledgeGain을 제안합니다. 인간 연구를 통해 검증된 이 지표는 LLM 독자 시뮬레이터를 보정하여 뉴스 기사의 품질을 효과적으로 순위 매기고 필터링할 수 있습니다.

TARIC: 중단된 시맨틱 단서 하에서의 메모리 증강 주행 가능성 인식 실외 VLN

시맨틱 단서가 중단되는 실외 VLN 환경에서 주행 가능성을 고려하여 목표 지향적 안내를 유지하는 TARIC 프레임워크를 제안합니다. 3D 단서 메모리와 불확실성 인식 메커니즘을 통해 단서 부재 시에도 안정적인 경로 탐색을 가능하게 합니다.

이 피드 구독하기

RSSFeedly, Inoreader 등으로 구독

API/api/search?q=검색어

AIllms.txt로 AI 크롤링 가이드

본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.