Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

Positive--Unlabeled Learning을 통한 LLM 평가의 정량화 및 감사

LLM-as-a-Judge 시스템의 장황성 편향 문제를 해결하기 위해 Positive-Unlabeled(PU) 학습을 적용한 새로운 평가 프레임워크를 제안합니다. 부분 최적 운송(Partial Optimal Transport) 기법을 통해 인간의 선호도와 일치하도록 편향된 판사를 재학습 없이 교정합니다.

1일 전0

arXiv논문

회복 탄력성이 있는 사이버 물리 시스템을 위한 모델 프리 강화학습 (Model-Free Reinforcement Learning) 제어

사이버 공격 상황에서 비선형 시스템의 회복 탄력성을 높이기 위한 모델 프리 강화학습 제어 기법을 연구합니다. 다양한 RL 보상 유형과 제어 알고리즘의 성능을 비교 분석하여 최적의 보상 설계 방안을 제시합니다.

1일 전0

arXiv논문

마르코프 결정 과정 (MDP)을 이용한 제2형 당뇨병 관리를 위한 후속 진료 간격의 문맥 인식 최적화

마르코프 결정 과정(MDP)을 활용하여 제2형 당뇨병 환자의 개인별 맞춤형 진료 간격을 최적화하는 연구를 소개합니다. EHR 데이터를 기반으로 환자를 문맥별로 분류하여, 질병 상태에 따라 진료 주기를 유연하게 조정함으로써 의료 비용을 절감하고 관리 효율을 높였습니다.

1일 전0

arXiv논문

비선형성보다 구조: 동적 학습을 위한 명시적 상호작용 아키텍처

비선형성 대신 구조적 설계를 통해 동적 시스템을 학습하는 새로운 아키텍처를 제안합니다. 파동 기반의 명시적 구조화된 동적 유닛을 사용하여 암시적 솔버 없이도 효율적인 계층적 동작을 구현합니다.

1일 전0

arXiv논문

매끄러운 손실 함수를 위한 PAC-Bayes 경계의 매끄러움 기반 비무작위화 (Smoothness-Based Derandomization of

매끄러운 손실 함수를 대상으로 PAC-Bayes 비무작위화 연구를 통해 결정론적 예측기의 일반화 경계를 도출합니다. Jacobian과 Hessian을 활용한 평탄도(flatness) 개념을 통해 일반화 간극을 제어하며, 이를 신경망 정규화의 이론적 근거로 제시합니다.

1일 전0

arXiv논문

JourneyFormer: 시퀀스 모델링을 통한 Airbnb 게스트 여정 인코딩

Airbnb는 게스트의 복잡한 행동 시퀀스를 모델링하여 검색 랭킹을 개선하는 JourneyFormer를 개발했습니다. 이 연구는 시퀀스의 복잡성과 희소한 레이블 문제를 해결하기 위한 모델 아키텍처 및 운영 최적화 전략을 다룹니다.

1일 전0

arXiv논문

분포형 결과(Distributional Outcomes)를 위한 Wasserstein 정책 학습

분포형 결과(distribution-valued outcomes)를 가진 오프라인 정책 학습에 관한 연구입니다. Wasserstein barycenter를 활용한 보상 정의와 IPW 및 DR 추정치 기반의 정책 학습 프레임워크에 대한 통계적 보장을 다룹니다.

1일 전0

arXiv논문

추론 전 인지하기: 지름길에 강한 멀티모달 온폴리시 자기 증류를 위한 인지와 추론의 분리

멀티모달 모델 학습 시 텍스트에만 의존하는 지름길 문제를 해결하기 위해 인지와 추론을 분리한 ViGOS 프레임워크를 제안합니다. 시각적 설명을 먼저 작성하도록 유도하여 이미지 기반의 근거 있는 추론을 강화합니다.

1일 전0

arXiv논문

Giskard: 대규모 분산 학습을 위한 Byzantine 강건성 및 기밀성 집계

분산 학습 환경에서 기밀성 보장과 Byzantine 공격에 대한 강건성을 동시에 확보하기 위한 새로운 프로토콜 Giskard를 제안합니다. 위원회 트리 구조와 MPC를 활용하여 대규모 참여자 환경에서도 확장성 있는 보안 집계를 구현했습니다.

1일 전0

arXiv논문

INDEQS: 정보가 주입된 신경 제어 미분 방정식 (Informed Neural controlled Differential EQuationS)

INDEQS는 유향 그래프의 사전 지식을 신경 제어 미분 방정식(NCDE)에 통합하여 시계열 예측 성능을 높이는 새로운 프레임워크입니다. 내부 및 외부 혼합 방식을 통해 그래프 구조를 학습하며, 수문 및 교통 흐름 예측 등 실제 벤치마크에서 우수한 성능을 입증했습니다.

1일 전0

arXiv논문

ChronoSurv: 멀티모달 생존 분석을 위한 임상 경로 가이드 그래프 프레임워크

ChronoSurv는 멀티모달 임상 데이터를 활용하여 환자의 생존을 예측하는 계층적 유향 그래프 프레임워크입니다. 임상 궤적을 반영한 계층적 토폴로지와 이질적 메시지 패싱을 통해 결측 데이터에 유연하게 대응하며 최첨단 성능을 달성했습니다.

1일 전0

arXiv논문

국소적 모집단 위험 인증서에 대하여

모델 주변의 모집단 위험 증가분에 대한 국소적 인증서(local certificates)를 제안하는 논문입니다. 국소적 후보 집합 내에서 위험 변화량에 대한 양방향 신뢰 구간을 제공하며, 이를 통해 위험 제어 업데이트 규칙을 수립할 수 있습니다.

1일 전0

arXiv논문

OpenAnt: 코드 분해, 적대적 검증 및 동적 테스트를 통한 LLM 기반 취약점 발견

OpenAnt는 LLM 기반의 의미론적 추론과 정적·동적 분석을 결합하여 대규모 코드베이스의 취약점을 자동으로 발견하는 오픈 소스 시스템입니다. 코드 분해, 적대적 검증, 동적 테스트를 통해 오탐을 줄이고 분석 효율성을 극대화합니다.

1일 전0

arXiv논문

효율적인 Transformer를 위한 상보적 어텐션 헤드 프루닝 (Complementary Attention Head Pruning)

Transformer 모델의 효율성을 높이기 위해 그래프 이론과 정보 이론을 결합한 새로운 어텐션 헤드 프루닝 프레임워크인 CAHP를 제안합니다. CAHP는 헤드 간의 상보성을 분석하여 최적의 헤드 집합을 자동으로 식별하며, 기존 방식보다 높은 압축률에서도 뛰어난 성능을 유지합니다.

1일 전0

arXiv논문

마스크 확산 모델 (Masked Diffusion Models)에서의 재귀적 스케일링 (Recursive Scaling)

마스크 확산 모델(MDM)의 성능을 높이기 위해 동일한 디노이징 트랜스포머를 반복 적용하는 재귀적 스케일링 기법인 R-MDM을 제안합니다. 이 방식은 파라미터 수를 늘리지 않고도 모델의 유효 깊이를 증가시켜 파라미터 효율성을 극대화합니다.

2일 전0

arXiv논문

LoopCoder-v2: 효율적인 테스트 시간 계산 스케일링을 위해 단 한 번만 루프 수행

LoopCoder-v2는 순차적 루핑의 지연 시간과 메모리 문제를 해결하기 위해 Parallel loop Transformers(PLT) 구조를 제안합니다. 연구 결과, 2회의 루프를 수행할 때 코드 생성 및 소프트웨어 엔지니어링 성능이 최적화됨을 확인했습니다.

2일 전0

arXiv논문

Flow 기반 시각-언어-행동(Vision-Language-Action) 모델을 위한 불확실성 정량화 (Uncertainty

Flow matching 기반의 시각-언어-행동(VLA) 모델에서 인식론적 불확실성을 정량화하는 새로운 방법을 제안합니다. 속도장 불일치(VFD)를 활용해 모델의 실패를 감지하고, 적은 데이터로도 새로운 작업에 적응할 수 있는 SAVE 프레임워크를 선보입니다.

2일 전0

arXiv논문

치명적 망각은 저차원이다: 지속적 적응을 위한 함수 공간 이론

지속적 학습 시 발생하는 치명적 망각 문제를 함수 공간(Function-space) 관점에서 분석한 연구입니다. NTK(Neural Tangent Kernel)를 활용해 망각 벡터를 예측하고, 망각이 특정 NTK 고유 모드에 집중된다는 사실을 밝혀냈습니다.

2일 전0

arXiv논문

ConTex: 시계열 예측을 위한 반사실적 생성(Counterfactual Generation)의 재구성

ConTex는 시계열 예측의 의사결정을 돕기 위해 반사실적 생성(Counterfactual Generation)을 전역적으로 일관된 전략으로 재구성한 연구입니다. 기존의 인스턴스별 최적화 방식이 가진 높은 계산 비용과 불일치 문제를 해결하여 실시간 적용이 가능한 모델 불가지론적 아키텍처를 제안합니다.

2일 전0

arXiv논문

INI-VPINN: 기하학적 특이점이 있는 다중 재료 도메인을 위한 암시적 Neumann 및 인터페이스 처리를 포함하는 변분 물리 정보 신경망

기하학적 특이점이 있는 다중 재료 도메인을 위해 Neumann 경계 및 인터페이스 조건을 암시적으로 처리하는 새로운 PINN 접근 방식인 INI-VPINN을 제안합니다. 이 방법은 추가적인 손실 항 없이도 물리적 일관성을 보장하며, 기존 방식보다 높은 정확도와 빠른 수렴 성능을 보여줍니다.

2일 전0

이 피드 구독하기

RSSFeedly, Inoreader 등으로 구독

API/api/search?q=검색어

AIllms.txt로 AI 크롤링 가이드