Insights
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
arXiv cs.AI 2266건필터 해제
AI 기반 서비스 개발의 아키텍처 제약 조건 정렬
본 기사는 AI 기반 도구가 생성한 코드 아티팩트가 실제 운영 환경(프로덕션)의 아키텍처 제약 조건이나 인프라 표준을 충족하지 못해 발생하는 문제를 지적합니다. 이를 해결하기 위해, 플랫폼 기반 코드 생성과 에이전트 명확화 루프를 결합한 '리트리벌 증강 스캐폴딩(retrieval-augmented scaffolding)' 접근법을 제안합니다. 이 방법은 템플릿 검색과 구조화된 상호작용을 통해 서비스 개발 과정에 프로덕션 관련 고려 사항을 통합하여, AI 코드 생성의 아키텍처 일관성과 배포 가능성을 크게 향상시킵니다.
Piper: 리소스 모델링과 파이프라인 하이브리드 병렬화를 통한 효율적인 대규모 MoE 훈련
본 기술 기사는 MoE(Mixture-of-Experts) 모델을 HPC 환경에서 효율적으로 훈련시키는 데 발생하는 메모리, 통신, 작업 불균형 등의 문제를 다룹니다. 이를 해결하기 위해 'Piper'라는 프레임워크를 제안합니다. Piper는 리소스 모델링을 활용하여 목표 플랫폼에 최적화된 훈련 전략을 식별하고, 파이프라인 병렬화를 적용함으로써 기존 대비 월등히 높은 MFU(Model Flops Utilization)와 대역폭 향상을 달성하는 것을 목표로 합니다.
한 번만 보아라, 두 번만 빔: 카메라 유도 실시간 양방향 mmWave 빔 관리를 위한 차량 연결성
본 논문은 V2X(차량-모든 것) 통신을 위한 실시간 양방향 mmWave 빔 관리 시스템인 VIsion-based BEamforming (VIBE)를 제안합니다. VIBE는 카메라 감지 정보를 활용하여 빔 탐색 공간을 효과적으로 줄이고, 기계 학습, 모델 기반 추론, 폐쇄 루프 RF 피드백을 결합한 하이브리드 구조를 채택했습니다. 이를 통해 기존 방법의 높은 훈련 오버헤드를 극복하고, 동적 환경에서 낮은 아웃레이지율과 뛰어난 일반화 능력을 갖춘 실시간 V2X 통신 솔루션을 제공합니다.
[SoK] 대형 언어 모델 (LLM) 의 제이브레이크 공격에 대한 견고성: 체계적 분류 및 평가 프레임워크
본 논문은 대형 언어 모델(LLMs)이 적대적 프롬프트 기반의 제이브레이크 공격에 취약하다는 문제를 다루며, 기존 평가 방법론의 한계를 지적합니다. 이를 해결하기 위해 'Security Cube'라는 통합 다차원 평가 프레임워크를 제안합니다. 이 프레임워크를 통해 다양한 공격 및 방어 기법을 체계적으로 분류하고 벤치마크함으로써, LLM 보안 취약점과 견고성을 종합적으로 분석하고 향후 연구 방향을 제시하는 것을 목표로 합니다.
텍스트 코퍼스 개념 필드: 블랙박스 환각 및 신규성 측정
본 기술 기사는 '개념 필드(Concept Field)'라는 새로운 개념을 소개하며, 이를 통해 텍스트의 블랙박스 환각 여부와 신규성을 측정하는 방법을 제시합니다. 이 방법은 문장 임베딩 공간에서 국소 편차 필드를 정의하고, 후보 문장의 전이(transition)가 이 필드와 얼마나 일치하는지를 점수화하여 해석 가능한 지표를 제공합니다. 또한, 벡터 시퀀스 데이터베이스(VSDB)를 도입하여 계산 효율성을 높였으며, 규정법 및 Project Gutenberg 등 다양한 도메인에서 그라운드드니스와 신규성 탐지 성능을 입증했습니다.
Driver-WM: 차내 역동성을 위한 외부 교통 상황에 조건부 잠재 세계 모델
Driver-WM은 자율주행 시스템의 안전성을 높이기 위해 외부 교통 상황에 조건화된 차내 역동성 예측 잠재 세계 모델입니다. 기존 주행 세계 모델이 외부 환경 예측에 치중했던 것과 달리, Driver-WM은 물리적 운동학 예측과 드라이버의 행동 및 감정적 의미 인식을 통합하여 차량 내부의 복잡한 동역학을 다단계로 롤아웃할 수 있습니다. 이 모델은 듀얼 스트림 아키텍처와 게이트 인가 메커니즘을 통해 외부 컨텍스트를 내부 상태에 조건적으로 주입하며, 반응성이 높은 상황에서도 장기적이고 의미론적으로 정렬된 예측 성능을 보여줍니다.
장기 문맥 모델링의 불가능 삼각형
본 논문은 장기 시퀀스 모델링에 내재된 근본적인 트레이드오프를 '불가능 삼각형'으로 형식화하고 증명합니다. 이 삼각형은 효율성(단계당 계산 비용), 압축성(상태 크기), 그리고 회상 능력(장기 의존성 기억) 세 가지 속성을 동시에 만족하는 모델이 존재할 수 없음을 보여줍니다. 연구진은 트랜스포머, SSM, RNN 등 다양한 아키텍처를 통합한 온라인 시퀀스 프로세서 추상화 내에서 이 한계를 수학적으로 증명하며, 실제 실험을 통해 이론적 한계가 경험적으로도 유효함을 검증합니다.
Think-Aloud Reshapes Automated Cognitive Model Discovery Beyond Behavior
기존의 자동 인지 모델 발견은 행동 데이터에만 의존하여 모델이 불완전한(under-determined) 경우가 많았습니다. 본 연구는 '생각하는 과정'을 기록한 Think Aloud 데이터를 새로운 데이터 제약 조건으로 활용했습니다. 이 접근 방식은 위험 결정 분야에서 예측 성능을 크게 향상시켰으며, 발견된 인지 모델의 구조를 행동 기반 모델과 다른 방식으로 체계적으로 변화시키는 것을 보여주었습니다.
LLM 시스템의 지속적 지식 업데이트: 다중 시간 척도 기억 역학을 통한 학습
본 논문은 LLM이 끊임없이 변화하는 환경에 적응하기 위해, 생물학적 기억 시스템의 원리를 모방한 지속적인 지식 업데이트 메커니즘을 제안한다. 기존 외부 메모리 시스템들이 명시적으로 관리되는 것과 달리, 이 접근 방식은 다중 시간 척도 역학(multi-timescale dynamics)을 활용하여 새로운 연관성을 즉각 사용 가능하게 하고, 반복된 정보를 강화하며, 불필요한 정보는 선택적으로 망각하는 방식으로 작동한다. 이를 통해 외부 기억을 자체적인 재구성 학습 기질로 재정의할 수 있다.
불완전한 의료 데이터에서 공동 치료 효과 추정: LLM 기반 진화적 MNAR 임푸티션과 시간적 인과 정규화 플로우
본 논문은 임상 환경에서 흔히 발생하는 데이터의 불완전성(MNAR 누락)과 시간적 혼란을 동시에 다루어 치료 효과를 추정하는 2단계 파이프라인을 제안합니다. 첫 번째 단계인 CausalFlow-T는 DAG 제약 기반의 정규화 플로우로, 명시적인 인과 구조를 활용하여 정확한 반허상(counterfactual) 추론을 수행합니다. 두 번째 단계에서는 LLM 기반 진화적 임푸터가 MNAR 누락된 바이오마커와 인과 지표를 효과적으로 복원하며, 이 파이프라인은 실제 EHR 데이터에서 높은 회복력과 정확도를 입증했습니다.
오프라인에서 온라인 강화학습 (O2O-RL) 에서 상호작용 예산 하의 적응형 정책 선택 및 미세 조정
본 논문은 오프라인에서 온라인 강화학습(O2O-RL)의 한계를 극복하기 위해, 제한된 온라인 상호작용 예산 하에서 정책 선택 및 미세 조정을 위한 적응형 접근 방식을 제안합니다. 기존 O2O-RL 방식은 신뢰도가 낮은 오프-정책 평가(OPE)에 의존하거나, 과도한 온라인 상호작용을 요구하는 문제가 있었습니다. 본 연구는 먼저 다양한 후보 정책을 학습하고 OPE로 초기 성능을 추정한 후, 상한 신뢰 구간(UCB) 접근법을 활용하여 예측된 성능에 기반해 가장 효율적으로 정책을 선택하고 미세 조정함으로써 실제 환경에서의 적용 가능성을 높였습니다.
LineRides: 자전거 로봇 스텝을 위한 라인 가이드 강화 학습
LineRides는 사용자 제공 공간 가이드라인과 희소 키 방향(key-orientations)만을 사용하여 자전거 로봇의 다양한 스텝 동작을 학습하는 새로운 라인 가이드 강화 학습 프레임워크입니다. 기존 방법들이 데모나 명시적 타이밍에 의존하는 한계를 극복하며, 물리적으로 불가능한 경로도 추적 마진을 통해 처리할 수 있습니다. Ultra Mobility Vehicle(UMV) 테스트에서 LineRides는 정상 주행과 MiniHop, LargeHop 등 5가지 스텝 동작 간의 원활하고 명령 기반 전환 능력을 입증했습니다.
Drifting Models 의 Wasserstein Gradient Flow 해석에 관한 연구
본 논문은 Deng et al. (2026)가 제안한 Generative Modeling via Drifting (GMD) 프레임워크를 Wasserstein Gradient Flows (WGF) 관점에서 분석합니다. 연구진은 GMD의 특정 알고리즘이 Parzen smoothing을 적용한 밀도에서의 KL divergence WGF 극한점과 대응됨을 증명했습니다. 또한, 이 아이디어가 Sinkhorn divergence, MMD, sliced Wasserstein distance 등 다양한 다른 WGF로 확장 가능함을 보여주었습니다.
실제적인 학습된 이미지 압축에서 중요한 요소
본 연구는 인간 시각 시스템에 최적화된 실용적인 학습된 이미지 압축 코덱을 설계하는 데 중점을 둡니다. 기존 전통 코덱 대비 감각적 품질과 실제 실행 시간(runtime)을 동시에 고려하여 모델링 선택 및 아블레이션 기법을 종합적으로 연구했습니다. 그 결과, 신경망 구조 검색(NAS)을 통해 최적화된 새로운 코덱을 개발했으며, 이 코덱은 AV1, VVC 등 기존 표준 대비 2.3-3배의 비트레이트 절감 효과를 보여주면서도, 모바일 기기에서 매우 빠른 인코딩/디코딩 속도를 달성했습니다.
코딩 에이전트를 활용한 ARC-AGI-3 실행 가능한 월드 모델 평가
본 기술 기사는 코딩 에이전트 시스템을 사용하여 ARC-AGI-3 게임에 대한 실현 가능한 월드 모델 평가 결과를 보고합니다. 이 시스템은 이전 관찰을 검증하고, MDL 기반 단순성 편향의 대안으로 추상화하여 계획을 세우는 방식으로 작동합니다. 25개의 공개 게임 테스트 결과, 에이전트는 7개 게임을 완전히 해결했으며, 평균적으로 상대적 인간 행동 효율성(RHAE)은 32.58%를 기록하며 유망한 초기 성능을 보여주었습니다.
중첩은 필수가 아니다: 시계열 예측을 위한 트랜스포머 표현에 대한 기계적 해석 가능성 분석
본 논문은 시계열 예측에 사용되는 트랜스포머 아키텍처가 NLP에서처럼 복잡한 '중첩(redundancy)' 표현에 의존하는지에 대한 기계적 해석 가능성 분석을 수행했습니다. 희소 오토인코더(SAE)를 사용하여 PatchTST의 내부 표현을 탐지한 결과, 트랜스포머의 성능이 강한 중첩에 의존한다는 경험적 증거는 발견되지 않았습니다. 대신, 이 표현들은 희소하고, 차원 확장에도 안정적이며, 잠재적인 개입에 대해 비교적 둔감함을 보여주었습니다. 이는 시계열 예측에서 트랜스포머의 성공이 반드시 풍부한 구성 표현을 요구하지 않으며, 단순 선형 모델의 경쟁력을 설명하는 데 도움을 줄 수 있음을 시사합니다.
Aes3D: 3D 고스 Splatting(3DGS) 의 미적 평가
본 논문은 3D Gaussian Splatting (3DGS) 기반의 3D 콘텐츠 제작에서 간과되어 온 '미학(Aesthetics)' 평가 문제를 다룹니다. 기존 방법들이 재구성 정밀도에만 초점을 맞춘 한계를 극복하기 위해, 연구진은 체계적인 미적 평가 프레임워크인 Aes3D와 이를 위한 데이터셋 Aesthetic3D를 제안했습니다. 또한, 3DGS 표현 자체에서 장면의 미학 점수를 직접 예측하는 경량 모델인 Aes3DGSNet을 제시하여, 계산 효율성을 유지하면서도 상위 수준의 미적 특성 포착 능력을 입증했습니다.
SemEval-2026 Task 9: 다국어 극단성 감지 (Multilingual Polarization Detection) 시스템 소개 -
본 기술 기사는 SemEval-2026 Task 9: 다국어 극단성 감지 시스템을 소개하며, 22개 언어를 대상으로 하는 이진 분류 작업을 수행합니다. 핵심 접근 방식은 대형 언어 모델(LLM)의 합성 데이터 증강과 LoRA를 활용한 각 언어별 Gemma-3 모델 미세 조정입니다. 개발 집합에서 얻은 지식을 재학습 없이도 전이 학습 및 앙상블 기법을 통해 테스트 환경에 성공적으로 적용하여, 모든 22개 언어에서 평균 매크로-F1 점수 0.811을 달성하며 높은 성능을 입증했습니다.
기하학적 인식을 위한 상태 공간 모델: 전체 슬라이스 이미지 표현의 새로운 패러다임
본 논문은 전체 슬라이스 이미지(WSI) 분석에서 기존 방법들이 간과했던 조직의 계층적 구조와 지역적 이질성을 포착하기 위해 새로운 접근 방식을 제안합니다. 연구진은 WSI 특징을 쌍중 기하학적 공간(hyperbolic-Euclidean)에 임베딩하는 하이브리드 표현을 도입하고, 이를 기반으로 BatMIL이라는 분류 프레임워크를 개발했습니다. 이 모델은 구조화된 상태 공간 시퀀스 모델(S4)과 청크 레벨 Mixture-of-Experts (MoE) 모듈을 결합하여 장기 의존성 포착 및 지역적 특성 고려라는 두 가지 목표를 달성하며, 최첨단 성능을 입증했습니다.
The First Token Knows: Single-Decode Confidence for Hallucination Detection
본 논문은 환각 탐지(hallucination detection)를 위해 여러 번의 디코딩을 필요로 하는 기존 방법들(Self-consistency, Semantic self-consistency)의 한계를 극복하는 새로운 접근 방식인 'phi_first'를 제안합니다. phi_first는 단일 그리디 디코딩 과정에서 첫 번째 토큰의 top-K 로짓 엔트로피를 사용하여 모델의 초기 신뢰도를 측정하며, 폐서적 사실 질문 답변(closed-book factual QA) 태스크에서 기존 방법들과 동등하거나 더 높은 성능을 보였습니다. 이는 다중 샘플링 기반 불확실성 정보가 이미 첫 번째 토큰 분포에 상당 부분 포함되어 있음을 시사합니다.
이 피드 구독하기
본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.