Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

개념 기반 설명 가능성에서의 Zero-Shot 이미지 생성 평가를 위한 프레임워크

본 연구는 개념 기반 설명 가능한 AI(XAI)의 확장성 문제를 해결하기 위해 Zero-shot 텍스트-이미지(T2I) 생성 모델을 활용하여 합성 개념 데이터셋을 생성하는 방법론을 제안합니다. 생성된 합성 데이터가 실제 개념을 얼마나 충실하게 반영하는지 네 가지 분석 지표를 통해 평가하며, T2I 모델을 활용한 데이터 생성의 잠재력과 동시에 직면한 과제들을 제시합니다.

5월 20일1

arXiv논문

StableGrad: Batch Normalization 없이 역전파 스케일 제어하기

StableGrad는 Batch Normalization 없이도 신경망의 깊이에 따른 가중치와 그래디언트의 불균형을 제어할 수 있는 옵티마이저 수준의 스케일 제어 메커니즘입니다. 순방향 모델을 수정하지 않고 역전파 단계에서만 재스케일링을 적용하여, 물리 정보 신경망(PINNs)과 같이 배치 의존적 정규화가 부적절한 환경에서도 안정적인 학습을 지원합니다.

5월 20일1

arXiv논문

열거된 솔루션을 통한 CNN 패턴 인식을 활용한 효율적인 제약 추론

본 연구는 제약 프로그래밍(Constraint Programming)의 효율성을 높이기 위해 CNN과 LLM을 결합한 새로운 스트림라이너(Streamliner) 합성 방식을 제안합니다. CNN을 통해 솔루션의 구조적 패턴을 대조 학습하여 탐지하고, 이를 LLM의 프롬프트로 활용함으로써 기존의 텍스트 기반 방식보다 정교한 MiniZinc 스트림라이너를 생성합니다. 실험 결과, Vessel Loading 및 Social Golfers 등 주요 벤치마크에서 수백 배 이상의 획기적인 속도 향상을 달성했습니다.

5월 20일2

arXiv논문

딥테크에서 우주로: 우주 데이터 센터(Space Data Centers)와 엣지(Edge)에서의 AI 혁명

위성 데이터의 폭발적 증가로 인한 지상 전송의 병목 현상과 지연 문제를 해결하기 위해 궤도 내에서 데이터를 직접 처리하는 우주 데이터 센터(SDC) 개념을 제안합니다. 본 논문은 저궤도(LEO) 위성 군집을 활용한 SDC 아키텍처와 기술적 타당성, 경제적 생존 가능성을 분석합니다.

5월 20일0

arXiv논문

실시간 병렬 반사실적 후회 최소화 (Real-Time Parallel Counterfactual Regret Minimization)

본 논문은 불완전 정보 게임을 해결하기 위한 CFR(Counterfactual Regret Minimization) 알고리즘을 실시간으로 실행할 수 있도록 설계된 최초의 병렬화 프레임워크인 Parallel CFR을 제안합니다. 정보 집합 및 트리 노드 단위의 병렬성과 GPU를 활용한 배치 신경망 추론을 결합하여, 단일 스레드 대비 최대 3.4배의 속도 향상을 달성했습니다. 이를 통해 일반적인 데스크톱급 장치에서도 실시간 게임 플레이에 필요한 충분한 반복 횟수를 확보할 수 있음을 입증했습니다.

5월 20일0

arXiv논문

부분적 쌍별 지도 학습을 이용한 빠르고 특징 없는 노드 표현 학습

노드 특징(node features)이 없는 그래프 환경에서 부분적인 쌍별 레이블만을 활용하여 효율적으로 노드 표현을 학습하는 Contrastive FUSE 프레임워크를 제안합니다. 커뮤니티 인지 구조 신호와 부호가 있는 쌍별 제약 조건을 통합한 스펙트럼 대조 목적 함수를 사용하며, 모듈성 그래디언트를 경량화된 근사치로 대체하여 대규모 그래프에서도 빠른 학습이 가능합니다. 실험 결과, 기존 방식 대비 뛰어난 실행 속도와 함께 경쟁력 있는 분류 성능을 입증했습니다.

5월 20일0

arXiv논문

대규모 시각-언어 모델(VLMs)의 저비트 양자화(Quantization)를 위한 모달리티 이질성 극복

본 연구는 시각-언어 모델(VLMs)의 저비트 사후 훈련 양자화(PTQ) 시 발생하는 텍스트와 시각 모달리티 간의 활성화 분포 불일치 문제를 해결하기 위한 SplitQ 프레임워크를 제안합니다. SplitQ는 모달리티 특화 이상치 채널을 격리하는 MOCD 모듈과 양자화 오차를 동적으로 완화하는 ACC 모듈을 통해 모델의 정확도 저하를 최소화합니다. 실험 결과, SplitQ는 W3A3와 같은 극한의 양자화 설정에서도 FP16 성능의 93.5%를 유지하며 기존 방식보다 뛰어난 성능을 입증했습니다.

5월 20일0

arXiv논문

StruMPL: 비연결적 부분 감독 및 MNAR 레이블 하에서의 멀티태스크 밀집 회귀

StruMPL은 위성 라이다 데이터와 지상 조사구 데이터가 서로 다른 변수를 제공하는 비연결적 부분 감독 상황에서 산림 생물량을 추정하기 위한 멀티태스크 밀집 회귀 프레임워크입니다. 데이터가 무작위가 아닌 방식으로 누락된 MNAR(Missing Not At Random) 상황을 해결하기 위해 공유 인코더, 임퓨테이션 및 성향 헤드, 그리고 물리적 제약 조건을 평가하는 학습 가능한 물리 모듈을 결합했습니다. 실험 결과, StruMPL은 기존 방법론보다 AGB(산림 지상부 생물량)의 RMSE와 편향 측면에서 우수한 성능을 보였으며, 특히 AIPW를 통해 편향을 약 54% 감소시켰습니다.

5월 20일1

arXiv논문

사회적으로 민감한 영역 내 파운데이션 모델을 위한 로보틱스 기반 가드레일 (Robotics-Inspired Guardrails)

사회적으로 민감한 영역에서 사용되는 파운데이션 모델의 안전성을 확보하기 위해 로보틱스의 제어 개념을 도입한 새로운 가드레일 접근 방식을 제안합니다. 기존의 사후 중재 방식에서 벗어나, 상호작용을 하나의 궤적으로 보고 런타임에 행동을 제어하는 Grounded Observer 프레임워크를 통해 일상 대화 및 치료 환경에서의 안전한 상호작용을 구현합니다.

5월 20일3

arXiv논문

하이브리드 체화된 작업에서의 장기적 진화를 위한 World-Ego 모델링

본 논문은 체화된 지능(Embodied intelligence)에서 세계(World)와 에고(Ego)의 역학이 얽혀 발생하는 성능 저하 문제를 해결하기 위해 World-Ego Modeling(WEM) 패러다임을 제안합니다. WEM은 세계와 에고를 분리하여 예측하는 플래너와 계층적 병렬 전문가 혼합(CP-MoE) 확산 생성기를 결합한 모델입니다. 또한, 내비게이션과 조작이 결합된 하이브리드 작업을 평가하기 위한 최초의 벤치마크인 HTEWorld를 구축하여 최첨단 성능을 입증했습니다.

5월 20일0

arXiv논문

확률적 Tiny Recursive Model (Probabilistic Tiny Recursive Model)

Tiny Recursive Models(TRM)의 결정론적 재귀로 인한 하위 솔루션 수렴 문제를 해결하기 위해, 각 재귀 단계에 가우시안 노이즈를 주입하는 Probabilistic TRM(PTRM) 프레임워크를 제안합니다. PTRM은 별도의 재학습 없이도 확률적 탐색을 통해 다양한 솔루션을 탐색하며, 매우 적은 파라미터로도 거대 언어 모델(LLMs)을 능가하는 높은 정확도를 달성합니다.

5월 20일0

arXiv논문

순차적 엔트로피 변화를 통한 유창한 최적화 기반 적대적 프롬프트 탐지

본 연구는 유창함을 유지하며 LLM을 탈옥하는 최적화 기반 적대적 접미사를 탐지하기 위해 토큰 수준의 엔트로피 변화를 추적하는 CPD Online(CPD) 기법을 제안합니다. CPD는 별도의 학습 없이 온라인으로 실행되며, 기존 퍼플렉시티 기반 탐지기보다 높은 정확도로 적대적 공격의 시작 지점을 국소화할 수 있습니다. 또한 LLaMA Guard의 경량 게이트로 활용 시 탐지 품질을 유지하면서도 가드 호출 횟수를 17-22% 절감하는 효율성을 보여주었습니다.

5월 20일0

arXiv논문

블록-구체 벡터 양자화 (Block-Sphere Vector Quantization)

본 논문은 최근 주목받는 회전 기반 벡터 양자화 기법들(EDEN, RabitQ, TurboQuant)에 대한 통합적인 이론적 비교를 제공합니다. 이를 바탕으로 구형 기하학을 활용하여 임베딩의 구조를 더 잘 보존하는 새로운 블록 양자화 알고리즘인 BlockQuant를 제안하며, 재구성 MSE와 기대 내적 왜곡 측면에서 기존 방식보다 뛰어난 성능을 입증했습니다.

5월 20일0

arXiv논문

선견지명을 통한 학습: 다중 노드 앞서보기 예측(Multi-Node Lookahead Prediction)을 통한 신경망 라우팅 정책 강화

기존의 신경망 정책이 다음 노드 예측에만 집중하여 발생하는 근시안적 의사결정 문제를 해결하기 위해 '다중 노드 앞서보기 예측(MnLP)' 전략을 제안합니다. MnLP는 학습 과정에서 여러 미래 노드를 동시에 예측하도록 하여 모델이 장기적인 계획 능력을 갖추게 하며, 추론 시에는 추가적인 오버헤드 없이 효율성을 유지합니다.

5월 20일0

arXiv논문

LLM 벤치마크 데이터셋은 오염에 저항할 수 있어야 한다

LLM의 성능 평가를 위한 벤치마크 데이터셋이 사전 학습 데이터에 포함되어 발생하는 '오염(contamination)' 문제를 지적합니다. 본 논문은 모델이 학습할 수는 없지만 추론은 가능하도록 설계된 '오염 저항성(contamination-resistant)' 데이터셋의 필요성을 주장합니다. 이를 위해 Transformer 아키텍처의 학습과 추론 파이프라인 간 비대칭성을 활용한 수학적 접근법과 새로운 방법론 도입을 제안합니다.

5월 20일0

arXiv논문

에이전트 튜닝(Agentic Tuning)의 필요성: PostgreSQL에서 문서에서 실행으로

기존의 정적인 문서 기반 시스템 튜닝은 소프트웨어 업데이트에 따른 노후화와 파라미터 간 상호 의존성 무시라는 한계가 있습니다. 이를 해결하기 위해 전문가의 튜닝 방법론을 실행 가능한 기술로 변환하여 LLM 에이전트가 직접 최적화를 수행하는 PerfEvolve를 제안합니다. PostgreSQL 환경에서 테스트한 결과, 기존 방식 대비 최대 35.2%의 성능 향상을 달성했습니다.

5월 20일0

arXiv논문

GeoX: 셀프 플레이(Self-Play)와 검증 가능한 보상(Verifiable Rewards)을 통한 지리 공간 추론(Geospatial

GeoX는 대규모 인간 주석 데이터 없이도 지리 공간 추론 능력을 학습할 수 있는 셀프 플레이(Self-play) 프레임워크입니다. 실행 가능한 프로그램을 통해 검증 가능한 보상을 생성하며, 강화학습을 통해 멀티모달 정책과 검증기를 동시에 최적화합니다. 이를 통해 기존 VLM의 성능을 크게 향상시키고 지리 공간 이해를 위한 새로운 벤치마크를 제시합니다.

5월 20일0

arXiv논문

기술이 도움이 되지 않을 때: 공격적 사이버 보안 분야의 도구 기반 에이전트를 위한 절차적 지식에 관한 부정적 결과

LLM 에이전트의 성능을 높이기 위해 사용되는 '에이전트 기술(Agent Skills)'이 특정 도메인에서는 오히려 성능을 저하시킬 수 있다는 연구 결과가 발표되었습니다. 공격적 사이버 보안 환경에서 MCP 기반 CTF 에이전트를 분석한 결과, 환경의 피드백 대역폭이 높을 경우 제공된 기술이 불필요한 오버헤드가 되어 한계 이익이 급격히 감소함을 확인했습니다.

5월 20일0

arXiv논문

최적의 이중 베이지안 학습 (Optimal Double-Bayesian Learning)을 이용한 신경망 학습

본 논문은 신경망 학습의 핵심인 학습률(Learning Rate)을 최적화하기 위해 두 개의 대립하는 베이지안 프로세스를 활용하는 '이중 베이지안(Double-Bayesian)' 확률론적 프레임워크를 제안합니다. 기존의 경험적 방식에서 벗어나 이론적으로 최적의 학습률을 도출함으로써, 분류, 세그멘테이션, 탐지 등 다양한 작업에서 모델 성능을 입증했습니다.

5월 20일0

arXiv논문

AutoResearchClaw: 인간-AI 협업을 통한 자기 강화형 자율 연구

AutoResearchClaw는 기존의 선형적인 자율 연구 시스템의 한계를 극복하기 위해 설계된 멀티 에이전트 기반의 자율 연구 파이프라인입니다. 구조화된 토론, 자기 치유형 실행기, 인간 참여형 협업 및 실행 간 진화 메커니즘을 통해 과학적 발견 과정을 반복적이고 자기 강화적인 형태로 구현합니다. ARC-Bench 테스트 결과, AI Scientist v2 대비 54.7% 향상된 성능을 기록하며 연구 증폭기로서의 가능성을 입증했습니다.

5월 20일1

이 피드 구독하기

RSSFeedly, Inoreader 등으로 구독

API/api/search?q=검색어

AIllms.txt로 AI 크롤링 가이드