본문으로 건너뛰기

© 2026 Molayo

Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

arXiv논문

Fed-CausalDiff: 연합 Do-Simulation 및 정책 평가를 위한 분리된 동기화

연합 학습 환경에서 개입적 추론과 정책 평가를 수행하기 위한 새로운 프레임워크인 Fed-CausalDiff를 제안합니다. 글로벌 인과 메커니즘과 로컬 교란 요인을 분리하여 동기화하는 DSS 방식을 통해 추정 정확도를 높였습니다.

3일 전0
arXiv논문

가위 효과 (The Scissors Effect): 리사이즈 기반 입력 다양성 (Input Diversity)이 전이 공격 (Transfer

입력 다양성(DI)이 전이 기반 적대적 공격의 성공률에 미치는 영향이 모델의 강건성 체제에 따라 상반되게 나타나는 '가위 효과(Scissors Effect)'를 규명합니다. 강건하게 훈련된 모델에서는 리사이징 기반의 DI가 오히려 공격 성공률을 낮추는 현상을 그래디언트 기하학 관점에서 분석합니다.

3일 전0
arXiv논문

SamatNext v0.2-B: 소규모 코드 모델의 커리큘럼 유지력을 위한 RMS 정규화 하이브리드 디코더에 관한 탐색적 연구

SamatNext v0.2-B는 RMS 정규화와 선형 상태 믹서를 결합한 356M 규모의 하이브리드 디코더 모델입니다. 순차적 미세 조정 과정에서 발생하는 치명적 망각 문제를 완화하여 코드 커리큘럼 유지력을 높이는 연구를 수행했습니다.

3일 전0
arXiv논문

완전 동형 암호 (FHE) 프레임워크의 취약점 탐지 및 이해

완전 동형 암호(FHE) 프레임워크의 구현 버그와 취약점을 탐지하기 위한 자동화된 테스트 도구 HERTA를 소개합니다. 변형 테스트(metamorphic testing)를 활용하여 수동 정답 없이도 FHE 소프트웨어 스택의 로직 오류를 찾아낼 수 있습니다.

3일 전0
arXiv논문

Hausa 및 Fongbe 기계 번역을 위한 대규모 언어 모델(LLM) 평가: 벤치마크, 실패 사례 및 지표 신뢰성

서아프리카 언어인 Hausa와 Fongbe를 대상으로 LLM의 기계 번역 품질과 자동 평가 지표의 신뢰성을 분석한 연구입니다. 언어별 모델 성능 차이와 자동 지표가 인간의 판단을 완벽히 반영하지 못하는 한계를 규명했습니다.

3일 전0
arXiv논문

발산 유도 가중치 디노이징을 통한 강건한 확산 모델 (Robust Diffusion Models via Divergence-Induced

데이터 오염 상황에서도 확산 모델의 성능을 유지하기 위해 f-발산을 활용한 새로운 디노이징 손실 함수를 제안합니다. 국소 발산 이론을 바탕으로 샘플별 기여도를 조절하는 가중치를 적용하여, 오염된 데이터의 영향을 억제하고 모델의 강건성을 높였습니다.

3일 전0
arXiv논문

생성적 강건 최적화 (Generative Robust Optimisation)

딥 생성 모델을 활용하여 복잡한 불확실성 집합을 정의하는 '생성적 강건 최적화(GRO)' 프레임워크를 제안합니다. 기존의 고정된 기하학적 형태를 넘어 비선형 상관관계와 다중 모드성을 수용하며, 5가지 체계적인 평가 기준을 통해 모델의 성능을 검증합니다.

3일 전0
arXiv논문

단백질 분류를 위한 하이브리드 양자 신경망(Hybrid Quantum Neural Networks)의 측정 유발 학습 불안정성 완화

하이브리드 양자 신경망(QNN)에서 발생하는 측정 유발 로짓 수축 현상과 그로 인한 학습 불안정성을 분석하고, 이를 해결하기 위한 '양자 측정 온도(QMT)' 기법을 제안합니다. QMT는 학습 가능한 스케일링 매개변수를 통해 기울기 민감도를 높여 QNN의 학습 안정성과 분류 정확도를 향상시킵니다.

3일 전0
arXiv논문

압전 복합재의 균질화를 위한 딥 재료 네트워크 (Deep material network)

압전 복합재의 효율적인 균질화를 위해 물리 정보 기반의 딥 재료 네트워크(PDMN)를 제안합니다. 기존 수치 시뮬레이션 대비 계산 비용을 3개 차수 이상 절감하면서도 높은 예측 정확도를 제공합니다.

3일 전0
arXiv논문

모델 불일치 상황에서의 정적 강건 평균장 게임 (Stationary Robust Mean-Field Games)

모델 불일치 상황에서 다중 에이전트 강화학습(MARL)의 성능 저하를 해결하기 위한 정적 강건 평균장 게임(Stationary Robust Mean-Field Games) 프레임워크를 제안합니다. 분포 모델 불확실성을 모집단 역학에 통합하여 균형의 존재를 증명하고 수렴성이 보장된 알고리즘을 개발했습니다.

3일 전0
arXiv논문

멀티태스크 모델 병합을 위한 훈련이 필요 없는 태스크 분류 (Training-free Task Classification for

멀티태스크 모델 병합 시 발생하는 파라미터 간섭 문제를 해결하기 위해 추가 학습 없이 태스크를 분류하는 SiM 기법을 제안합니다. SVD 기반의 저차원 매니폴드 근사를 통해 입력 데이터의 태스크를 식별하고 최적의 전문가 파라미터를 라우팅합니다.

3일 전0
arXiv논문

On-Policy Distillation의 위치 편향(Position Bias)에 대하여

On-Policy Distillation(OPD) 과정에서 발생하는 위치 편향 문제를 분석하고, 이를 해결하기 위한 IW-OPD 방법론을 제안합니다. 학생 모델의 롤아웃이 길어질수록 교사 분포와 멀어지는 현상을 제약 최적화 관점에서 규명했습니다.

3일 전0
arXiv논문

분할 가능한 가우시안 프로세스 추론 및 은닉 마르코프 모델을 통한 항성 플레어 탐지를 위한 확장 가능한 베이지안 가산 모델

가우시안 프로세스(GP)의 높은 계산 비용 문제를 해결하기 위해 VAE를 활용한 생성적 대리 프레임워크를 제안합니다. 이를 통해 Celerite 솔버의 복잡한 공분산 연산을 빠른 신경망 순전파로 대체하여 대규모 천문 데이터 분석 효율을 높였습니다.

3일 전0
arXiv논문

CodeTeam: 저장소 수준의 코드 생성을 위한 LLM 기반 멀티 에이전트 프레임워크

CodeTeam은 자연어 요구사항으로부터 전체 소프트웨어 저장소를 구축하는 LLM 기반 멀티 에이전트 프레임워크입니다. 계획, 의사 결정, 구현 단계를 분리하여 파일 간 인터페이스와 의존성을 관리하며, 기존 모델 대비 높은 코드 생성 성능과 테스트 통과율을 입증했습니다.

3일 전0
arXiv논문

MixedPEFT: 혼합 목적 함수를 통한 다중 PEFT 방법의 결합을 이용한 비지도 도메인 적응 (Unsupervised Domain

MixedPEFT는 혼합 목적 함수와 맞춤형 PEFT 아키텍처를 결합하여 비지도 도메인 적응 문제를 해결하는 새로운 연구입니다. LoRA와 가역 어댑터를 결합하여 소스 도메인의 분류 성능과 타겟 도메인의 MLM 성능을 동시에 최적화합니다.

3일 전0
arXiv논문

음성에서 텍스트 코퍼스로: 저자원 언어인 Fongbe 및 Hausa를 위한 ASR 기반 데이터 수집 평가

저자원 아프리카 언어인 Fongbe와 Hausa의 텍스트 코퍼스 확장을 위해 ASR 파이프라인을 활용한 데이터 수집 연구를 수행했습니다. MMS-300M과 Whisper 모델을 미세 조정하여 음성 데이터를 텍스트로 변환하고 그 품질을 평가했습니다.

3일 전0
arXiv논문

적절한 속도로 학습하기: 적응형 데이터 스케줄링(Adaptive Data Scheduling)을 통한 LLM 강화학습(RL) 개선

LLM 강화학습(RL)의 효율성을 높이기 위해 데이터 샘플링 방식을 개선한 적응형 데이터 스케줄링(ADS) 프레임워크를 제안합니다. 기존의 균등 샘플링 대신 의미론적 클러스터와 정책 경계 샘플을 활용하여 학습 성능을 최적화합니다.

3일 전0
arXiv논문

BabelJudge: 언어 및 에이전트 궤적 전반에 걸친 LLM-as-a-Judge 신뢰성 측정

LLM-as-a-Judge의 체계적 편향을 측정하고 감사하는 오픈 소스 프레임워크인 BabelJudge를 소개합니다. 위치, 장황함, 교차 언어 저하 등 네 가지 주요 실패 모드를 측정하며, 에이전트 평가를 위한 궤적 수준의 섭동 분석 기능도 포함합니다.

3일 전0
arXiv논문

연구는 어떻게 진화하는가? NLP, ML, CV에서의 주장 기반 유형별 인용을 통한 교차 도메인 궤적 추적

SciTraj 코퍼스를 통해 NLP, ML, CV 분야의 논문 인용 관계를 주장(claim) 기반의 유형별 그래프로 분석하는 새로운 방법론을 제안합니다. 기존의 단순 인용 그래프를 넘어 연구의 진화 궤적을 추적하고 학문적 흐름을 예측할 수 있는 벤치마크를 제공합니다.

3일 전0
arXiv논문

언어적 개입으로서의 호기심: LLM 튜터링 대화를 통한 탐구적 학습 행동의 영향

LLM의 대화 전략을 조작하여 학습자의 탐구적 인지 형성을 연구하는 CURIOBOT 프레임워크를 소개합니다. 호기심을 유도하는 언어적 개입이 학습자의 탐구적 질문과 대화 주도성을 유의미하게 증가시킴을 입증했습니다.

3일 전0

이 피드 구독하기

본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.