Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

Transformers Efficiently Perform In-Context Logistic Regression via Normalized

본 연구는 트랜스포머 모델이 컨텍스트 내에서 로지스틱 회귀와 같은 선형 분류 작업을 효율적으로 수행하는 원리를 탐구합니다. 특히, softmax 어텐션을 가진 다층 트랜스포머가 각 레이어마다 정규화된 경사 하강(normalized gradient descent)의 단계를 수행할 수 있도록 모델링했습니다. 연구 결과는 이러한 구조를 통해 트랜스포머가 인컨텍스트 러닝(ICL)을 효과적으로 수행하며, 이는 자기 주의 레이어와 루프 모델을 이용한 이론적 이해를 높여줍니다.

5월 8일6

arXiv논문

Edge-specific signal propagation on mature chromophore-region 3D mechanism

본 연구는 형광 단백질의 양자 수율(QY) 예측을 위해 크로모포어 중심 메커니즘 그래프 알고리즘을 제안합니다. 기존 모델들이 전역적 경향에 의존했던 것과 달리, 이 방법은 성숙한 크로모포르 영역에 작용하는 국소 물리 신호를 포착하여 단백질의 3차원 구조를 타입화된 잔기 그래프로 변환하고 채널 신호 전파를 통해 특징을 추출합니다. 실험 결과, 제안된 방법은 다양한 벤치마크에서 기존 모델들보다 우수한 성능을 보여주었으며, 특히 유사도가 낮은 원격 영역에서의 예측 능력이 뛰어남을 입증했습니다.

5월 8일7

arXiv논문

Why Global LLM Leaderboards Are Misleading: Small Portfolios for Heterogeneous

본 논문은 현재 LLM 리더보드가 전역적(global) 순위에 의존하는 것이 오해의 소지가 있으며, 모델 간의 성능 차이를 정확하게 반영하지 못함을 분석합니다. 연구진은 대규모 비교 데이터를 분석하여 상위 모델들이 통계적으로 구별하기 어려움을 발견하고, 이러한 실패가 언어 및 작업에 따른 구조적 의견 불균형 때문임을 밝혀냈습니다. 이에 대한 해결책으로 예측 오차와 커버율을 고려하는 $(λ, ν)$-포트폴리오 프레임워크를 제안하며, 이 방법론이 전역 랭킹보다 훨씬 더 많은 투표 데이터를 포착하고 모델의 진정한 성능을 복원할 수 있음을 입증했습니다.

5월 8일7

arXiv논문

Crafting Reversible SFT Behaviors in Large Language Models

본 논문은 대형 언어 모델(LLM)에 주입되는 지도 강화 학습(SFT) 행동의 구조적 제약 부족 문제를 해결하고자 합니다. 기존 방법들이 사후적인 상관관계만 식별하는 것과 달리, 연구진은 '캐리어(Carrier)'라는 개념을 도입하여 명시적 유틸리티 예산 하에서 라우팅 마스크와 모델 가중치를 동시에 최적화함으로써 행동을 희소하고 기계적으로 필요한 하위 네트워크로 의도적으로 압축합니다. 이를 위해 Loss-Constrained Dual Descent (LCDD)를 제안하여 캐리어를 구축하고, SFT-Eraser를 통해 이 캐리어 채널에서 활성화 매칭 기반의 소프트 프롬프트를 최적화함으로써 유도된 행동을 역전시킬 수 있음을 입증했습니다. 이러한 접근 방식은 학습된 행동이 인과적으로 필요한 구조에 위치함을 보여주며, 모델 배포 단계에서 특정 행동을 체계적으로 제어하고 억제하는 새로운 패러다임을 제시합니다.

5월 8일13

arXiv논문

Learned Neighbor Trust for Collaborative Deployment in Model-Agnostic

기존 분산 디스틸레이션 기법들은 훈련 시 협력에 초점을 맞추었으나, 실제 IoT 환경과 같이 이종적이고 자원이 제한적인 노드들이 존재하는 추론 단계에서는 각 노드를 고립시켜 배포하는 한계가 있었습니다. 본 연구는 모델에 구애받지 않는(model-agnostic) 프로토콜을 통해, 노드가 로컬 검증 증거를 기반으로 이웃의 신뢰도를 학습하고 이를 활용하여 훈련 중 협력을 정의하며 추론 시 배포 앙상블을 구성하는 방법을 제안합니다. 이 접근 방식은 적은 통신량으로도 높은 정확도를 달성하여 실제 분산 환경에 효과적으로 적용될 수 있습니다.

5월 7일10

arXiv논문

차량 추종 행동의 감속 모드별 운동학적 판별자: NGSIM 궤적 데이터에 대한 증거

본 연구는 NGSIM 궤적 데이터를 활용하여 감속 강도별로 차량 추종 행동을 운동학적으로 분석하고, 전통적인 운전 모델의 간격 중심 가정에 도전합니다. 연구진은 환경에서 측정 가능한 변수와 운전자 행동 패턴을 구분하는 2단계 프레임워크를 제시했으며, 급정차 시에는 'Gap-closing rate'이, 중간 감속 시에는 'visual looming'이 주요 판별적 단서임을 밝혀냈습니다. 이 결과는 자율주행 시스템의 경보 설계 및 제어 로직에 중요한 경험적 근거를 제공합니다.

5월 7일5

arXiv논문

다중 모달 생리학적 신호 기반 운전자 행동 분류: SHAP 기반 엘리트 특징 선택과 하이브리드 그라디언트 부스팅

본 연구는 뇌파(EEG), 근전도(EMG), 전도성 피부 반응(GSR) 등 다중 모달 생리학적 신호를 활용하여 운전자 행동을 분류하는 해석 가능하고 확장 가능한 프레임워크를 제안합니다. 이 접근법은 SHAP 기반의 특징 선택을 통해 고차원성을 관리하고, XGBoost와 LightGBM 모델에 대한 베이지안 최적화를 거친 가중치 소프트-보팅 앙상블을 구축했습니다. 그 결과, 단일 모달 대비 현저히 높은 정확도(80.91%)와 매크로-F1 점수(0.79)를 달성하며 다중 모달 융합의 우월성을 입증하고 모델 해석 가능성까지 확보했습니다.

5월 7일9

arXiv논문

임상 경고용 조건부 이상치 탐지

본 기술 기사는 전자 건강 기록(EHR) 시스템에 저장된 과거 환자 데이터를 활용하여 비정상적인 환자 관리 행동을 탐지하는 데이터 기반 접근법을 개발하고 평가했습니다. 연구진은 이러한 이상 징후가 잠재적 오류를 나타낼 수 있으며, 이를 통해 경고를 제기하는 것이 유용할 것이라는 가설을 세웠습니다. 심장 수술 후 환자의 EHR 데이터를 분석한 결과, 이상치 기반의 경고 시스템이 낮은 허위 경고율을 유지하면서도 강한 이상치는 높은 상관관계를 보여 효과적임을 입증했습니다.

5월 7일10

arXiv논문

DualTCN: 물리 제약 기반 시간 영역 MCSEM 역전용Temporal Convolutional Network

DualTCN은 시간 영역 해양 전자기(MCSEM) 데이터를 역분해하는 새로운 딥러닝 프레임워크입니다. 이 모델은 기존의 지하 이산화 방법에서 벗어나, 지구 모델의 네 가지 파라미터($σ_1$, $σ_2$, $d_1$, $d_2$)를 직접 회귀하고 미분 가능한 소프트-스텝 디코더를 사용하여 전도도-깊이 프로파일을 재구성합니다. DualTCN은 높은 예측 정확도와 빠른 계산 속도를 자랑하며, 전통적인 최적화 방법 대비 월등한 성능과 낮은 계산 비용을 입증했습니다.

5월 7일6

arXiv논문

시계열 데이터 기반 공간 영역 및 시간적 특징의 확장 가능한 추론

본 논문은 시계열 데이터를 기반으로 공간 영역 및 시간적 특징을 효율적으로 추론하는 비모수적(nonparametric) 지역화 프레임워크를 제안합니다. 기존 방법들이 정적 스냅샷에 의존하거나 공간 연속성을 강제하는 한계를 극복하며, 정보 이론의 최소 설명 길이 원리(MDL)를 활용하여 공간 분할과 대표 시계열 아키텍처('drivers')를 동시에 추론합니다. 이 접근 방식은 대규모 환경 데이터셋에서 해석 가능하고 확장 가능한 구조적 규칙성을 추출할 수 있음을 입증했습니다.

5월 7일10

arXiv논문

White Light Interferometry 를 활용한 Fully Convolutional Network 기반 칩 전체 CMP 모델링

본 논문은 IC 공정에서 중요한 역할을 하는 Chemical-Mechanical Polishing (CMP)의 정확한 예측 모델링을 목표로 합니다. 기존 방식이 가진 시간 소모 및 하드웨어 자원 문제를 해결하기 위해, White Light Interferometry (WLI)와 Atomic Force Microscopy (AFM) 두 가지 표면 분석 기법의 장점을 결합하여 딥러닝 기반 CMP 모델을 제안합니다. 이 CNN 기반 모델은 나노미터 단위의 정확도로 칩 전체의 CMP 후 나노 토포그래피를 예측함으로써, 설계 검증 단계와 시장 출시 시간을 가속화하는 데 기여할 것입니다.

5월 7일8

arXiv논문

불확실한 기하학 기반 임의적 다음 최적 뷰 선택을 위한 베이지안 접근법

본 기사는 점구름 기반 3D 재구성에서 특정 작업(task-specific)에 가장 유용한 다음 최적 뷰를 선택하는 프레임워크를 제안합니다. 이 방법은 베이지안 결정 이론을 사용하여 암시적 표면 공간의 사전 분포와 확률적 후분포를 결합하고, 이를 통해 단순히 불확실성을 줄이는 것이 아니라 재구성 데이터가 사용될 특정 다운스트림 작업에 가장 큰 영향을 미치는 영역에서만 불확실성을 체계적으로 감소시키는 카메라 뷰 선택을 수행합니다. 실험 결과는 이 접근법이 다양한 다운스트림 작업(의미 분류, 분할, 물리 시뮬레이션 등)에서 기존 방법보다 적은 수의 뷰로 더 우수한 성능을 보임을 입증했습니다.

5월 7일11

arXiv논문

정책을 밴디트 암으로 취급하는 트리 MDP 의 온라인 학습

본 논문은 트리 마르코프 의사결정 문제(T-MDP)의 온라인 학습 문제를 다루며, 이는 완전 기억을 가진 순차적 게임의 의사결정을 추상화합니다. 연구진은 기존 밴디트 알고리즘인 $\textsc{UCB}$와 $\textsc{LUCB}$를 T-MDP에 적용하는 방법을 제시하며, 정책 수가 상태 수에 지수적으로 증가하는 기술적 난제를 해결했습니다. 핵심 혁신은 데이터 공유 기반의 신뢰 구간 설계로, 이를 통해 밴디트 알고리즘을 다항식 메모리와 단일 단계 계산으로 구현할 수 있게 했으며, 이론적 상한선과 실험적 우수성을 입증했습니다.

5월 7일8

arXiv논문

실현 제약 하에서의 적응성: In-Context 학습과 Agentic 학습 비교

본 기사는 고정된 쿼리를 사용하는 In-Context 학습(ICL)과 적응적인 쿼리를 사용하는 Agentic 학습을 비교하여 작업 집합의 근사 성능을 평가합니다. 특히, 제약이 없는 환경과 ReLU 신경망으로 구현 가능한 실현 가능한 환경 두 가지 설정을 통해 이들을 분석했습니다. 연구 결과는 표현식 제약이 적응성 효과와 복잡하게 상호작용하며, 특정 시나리오에서는 적응성의 장점이 유지되거나(b), 오직 실현 가능성 하에서만 나타나는 경우(c)가 있음을 보여줍니다.

5월 7일8

arXiv논문

Windows COM 바이너리의 Agentic Vulnerability Reasoning: SLYP

SLYP는 Windows COM(Component Object Model) 바이너리의 경쟁 조건 취약점을 발견하고 검증된 PoC 코드를 생성하는 엔드 투 엔드 에이전트 기반 파이프라인입니다. 이 시스템은 바이너리 탐색, COM 점검, 동적 디버깅 기능을 재사용 가능한 도구 인터페이스로 제공하여 AI 에이전트가 취약점 발견부터 검증된 PoC 생성까지의 전 과정을 수행할 수 있도록 지원합니다. 벤치마크 결과와 실제 테스트에서 SLYP는 기존 코딩 에이전트보다 월등히 높은 성능을 보여주었으며, 미공개 취약점을 다수 발견하여 보안 가치를 입증했습니다.

5월 7일6

arXiv논문

CuBridge: LLM 기반의 고품질 Attention 커널 이해 및 재구성 프레임워크

CuBridge는 다양한 attention 변형을 지원하는 고품질의 CUDA attention 커널을 재구성하기 위한 새로운 프레임워크입니다. 이 프레임워크는 전문가가 작성한 CUDA 코드를 구조화된 lift-transfer-lower 워크플로우를 통해 추상화하고, 실행 가능한 중간 표현(IR)으로 승격시킵니다. 사용자가 PyTorch 사양만 제공하면 CuBridge가 최적화되고 정확성이 보장되는 CUDA 코드를 자동으로 생성하여, 기존 방법들의 성능 및 유연성 문제를 해결합니다.

5월 7일6

arXiv논문

장르 적응 화음 생성을 위한 팝과 재즈 믹스 비율에 대한 경험적 연구

본 논문은 화음 진행 생성이라는 비교적 덜 연구된 주제에 초점을 맞추어, 장르 적응(genre adaptation) 문제를 다룹니다. 특히 팝 음악으로 사전 학습된 Music Transformer 모델을 재즈 스타일로 미세 조정하는 과정을 경험적으로 탐구합니다. 이 연구는 새로운 도메인(재즈)을 습득하면서도 이전 도메인(팝)의 지식을 유지하기 위해 얼마나 많은 양의 원본 데이터가 필요한지, 즉 '잊어버림(catastrophic forgetting)' 문제를 다루고 있습니다.

5월 7일7

arXiv논문

직접 곱적류 매칭: 전도적 및 각운동 역학을 분리하는 소수 적응

본 논문은 기존 유동 매칭(Flow Matching, FM) 방법들이 교차 모달 정렬 과정에서 발생하는 기하학적 제약 조건들로 인해 최적의 적응 성능을 내지 못한다고 지적하며, 이를 해결하기 위한 새로운 프레임워크를 제시합니다. 연구진은 극좌표 분해 관점에서 세 가지 주요 한계(각운동 역학 왜곡, 반지름 역학 무시, 컨텍스트 무관 조건부 유동)를 식별하고, 이를 통합적으로 다루는 '왜곡된 곱적류 매칭(WP-FM)'을 제안합니다. 특히, 상수 왜곡 계량 기반의 '직접 곱적류 매칭(DP-FM)'은 반지름과 각운동 역학을 분리하여 독립적인 진화를 가능하게 함으로써 기존 방법들의 한계를 극복하고 최신 성능을 달성했습니다.

5월 7일5

arXiv논문

구조적 확률적 확산을 통한 하이퍼그래프 생성 (Hypergraph Generation via Structured Stochastic

본 논문은 고차원 상호작용을 모델링하는 하이퍼그래프의 현실적인 생성을 위한 새로운 접근 방식인 \HEDGE(하이퍼그래프 생성 모델)를 제안합니다. 이 모델은 완화된 발생 행렬 기반의 구조적 확률적 확산을 활용하며, 전진 과정에 특유의 양측 열 연산자와 오너스트-우헨백 구성 요소를 결합하여 데이터 구조를 유지하는 노이즈를 도입합니다. 이를 통해 하이퍼그래프의 조건부 목표와 역확산장(reverse-drift field)을 정확하게 학습하고, SDE 시뮬레이션을 통해 고품질의 하이퍼그래프 샘플을 생성할 수 있습니다.

5월 7일12

arXiv논문

보상 정규화를 통한 선호 기반 자기 증류: KL 매칭을 넘어

본 논문은 기존 온폴리시 자기 증류(on-policy self-distillation) 방법이 KL 매칭에 의존하여 겪는 훈련 불안정성 및 탐험적 다양성 부족 문제를 해결하기 위해 '보상 정규화 기반 자기 증류(PBSD)'를 제안합니다. PBSD는 교사 분포 직접 매칭 대신, 보상 가중치된 목표 정책을 생성하는 보상 정규화 목적 함수를 활용하여 온폴리시 학생 샘플링을 유지하면서도 성능과 안정성을 개선합니다. 실험 결과, PBSD는 다양한 벤치마크에서 기존 방법들보다 일관되게 우수한 평균 성능을 달성했습니다.

5월 7일8

이 피드 구독하기

RSSFeedly, Inoreader 등으로 구독

API/api/search?q=검색어

AIllms.txt로 AI 크롤링 가이드