Insights
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
arXiv cs.AI 2266건필터 해제
계획은 어디에 있는가? 경량 메커니즘 개입을 통해 언어 모델의 잠재적 계획 위치 찾기
본 논문은 언어 모델(LLM) 내에서 '계획' 메커니즘이 구조적으로 어떻게 형성되고 작동하는지 연구합니다. 특히, 미래 토큰의 내부 표현이 순전파 과정 중 어떤 방식으로 생성에 인과적으로 기여하는지에 초점을 맞춥니다. 운율 쌍 완성 같은 제약 조건 테스트를 사용하여 Qwen3, Gemma-3, Llama-3 등 여러 모델에서 경량 탐색 방법(선형 탐색 및 활성화 패치)을 적용한 결과, 미래의 운율 정보가 라인 경계에서 선형적으로 디코딩 가능함을 발견했습니다.
SCOPE: 복잡한 이미지 생성을 위한 구조적 분해 및 조건부 스킬 오케스트레이션
본 논문은 텍스트-이미지 모델이 여러 요구사항을 통합하여 복잡한 시각적 의도를 구현하는 데 어려움을 겪는 문제를 다룹니다. 이를 해결하기 위해, 연구진은 '의미론적 약속'을 구조적으로 유지하고 미해결된 약속 주변으로 검색, 추론, 복구 스킬을 조건부로 호출하는 명세 기반 오케스트레이션 프레임워크인 SCOPE를 제안합니다. SCOPE는 새로운 벤치마크 Gen-Arena와 평가 지표 EGIP를 도입하여, 복잡한 이미지 생성에서 지속적인 약속 추적의 효과를 입증하며 기존 모델들을 크게 능가하는 성능을 보여줍니다.
데이터 효율적이고 설명 가능한 공정-구조-특성(PSP) 예측을 위한 그래프 구조 초차원 컴퓨팅
본 논문은 다광자 광환원을 통한 복잡한 미세구조 제작 과정에서 발생하는 데이터 희소성 및 이질성 문제를 해결하기 위해 PSP-HDC라는 그래프 구조 초차원 컴퓨팅 프레임워크를 제안합니다. 이 프레임워크는 방향성 PSP(Process-Structure-Property) 그래프를 표현하고, 이를 추론 및 설명의 내부 사전으로 활용하여 공정-구조-특성 예측의 신뢰성과 일반화 성능을 크게 향상시킵니다.
VISTA: 적대적 환경에서의 분산 머신러닝
본 논문은 분산 머신러닝 환경에서 적대자가 워커 노드의 과반수를 통제하는 어려운 상황을 다룹니다. 기존의 견고한 집계 방법들이 정직 다수 가정에 의존하여 한계를 보였기 때문에, 본 연구는 인센티브 기반 프레임워크를 제안합니다. 이 프레임워크에서는 보고서가 상호 일관성을 유지할 때만 보상이 이루어지며, 적대자를 단순한 파괴자가 아닌 합리적인 경제 주체로 모델링하여 반복 최적화 문제를 해결하는 데 초점을 맞춥니다.
비디오 이해 보상 모델링: 강력한 벤치마크 및 고성능 보상 모델
본 논문은 비디오 이해 보상 모델링의 발전을 가로막는 평가 벤치마크 및 고품질 데이터 부족 문제를 해결하기 위한 통합 프레임워크를 제안합니다. 연구진은 일반, 장문, 추론 중심 작업을 포괄하는 2,100개의 선호도 쌍을 가진 Video Understanding Reward Bench (VURB)와 대규모 감독 데이터를 제공하는 Video Understanding Preference Dataset (VUP-35K)를 구축했습니다. 이 데이터셋을 기반으로 판별적(VideoDRM) 및 생성적(VideoGRM) 보상 모델을 훈련시켜, 기존 벤치마크에서 최첨단 성능을 달성했음을 입증합니다.
연합 학습 환경의 엣지 디바이스 생성 모델 트레이드오프에 관하여
연합 학습(FL)은 데이터 소유권을 보호하며 분산된 IoT 환경을 제어하는 유망한 패러다임입니다. 본 논문은 특히 예측 유지보수(PdM)와 같은 시계열 분석 분야에서 생성 모델(VAE, GAN, DM)의 활용에 초점을 맞춥니다. 연구는 전체 및 부분 연합 환경 모두에서 이러한 생성 모델들의 성능과 통신 오버헤드를 대역폭 제약적이고 비독립 동일 분포(non-IID) 조건 하에 포괄적으로 분석합니다.
PPI-Net: 분자 단백질 상호작용을 질병의 기능적 과정에 연결
PPI-Net은 단백질-단백질 상호작용(PPI) 네트워크와 Reactome 같은 경로 수준의 계층 구조를 통합하여 질병을 모델링하는 새로운 계층적 그래프 신경망입니다. 이 모델은 분자 수준의 PPI 정보부터 고차원적인 기능적 생물학적 과정까지 정보를 효과적으로 집계할 수 있습니다. 임상 데이터(RNA-seq 등)에 적용한 결과, 여러 암 유형에서 높은 예측 성능을 보였으며, 특히 계층적 구조를 통합함으로써 기존 모델 대비 정확도를 크게 향상시켰습니다.
TAVIS: 모방 학습을 위한 자아 중심 능동 시각 및 예측 응시의 벤치마크
본 기술 기사는 모방 학습(imitation learning)의 핵심 역량으로 부상한 능동 시각(Active vision)에 대한 표준화된 평가 벤치마크인 TAVIS를 소개합니다. TAVIS는 전역 검색을 위한 TAVIS-Head와 국부 가림을 다루는 TAVIS-Hands라는 두 가지 태스크 스위트를 포함하며, IsaacLab 기반의 휴머노이드 몸체 위에서 구축되었습니다. 이 벤치마크는 능동 시각이 다양한 작업 유형과 조건 하에 얼마나 기여하는지 정량적으로 평가할 수 있는 표준화된 환경을 제공합니다.
프레임당 토큰 하나: VLA 정책을 위한 월드 모델의 시각적 대역폭 재고찰
본 기사는 Vision-language-action (VLA) 모델이 장기 계획을 위해 사용하는 월드 모듈의 설계 문제를 다룹니다. 기존 방식은 높은 시각적 대역폭으로 프레임별 스트림을 전달하여 자원 비효율성을 초래했습니다. 이에 저자들은 각 뷰를 '프레임당 단일 의미론적 토큰'으로 압축하는 OneWM-VLA라는 새로운 접근 방식을 제안합니다.
TimeLesSeg: 확률적 생성 모델을 이용한 통합 대비 불가지론적 횡단 및 종단 MS 병변 분할
본 논문은 다발성 경화증(MS) 병변 분할의 어려움을 해결하기 위해 TimeLesSeg라는 통합 대비 불가지론적 프레임워크를 제안합니다. 이 프레임워크는 시간 차원의 유무와 관계없이 단일 CNN을 사용하여 MS 병변을 분할하도록 설계되었으며, 병리학적 사전 지식을 모델링하여 횡단적 처리의 가능성을 높였습니다. 실험 결과, TimeLesSeg는 기존 방법론보다 종단적 처리에 있어 더 정확하게 병변 부하 역학을 포착하며 우수한 성능을 보였습니다.
AI 평가를 위한 '사과와 사과' 비교로: 실제 사용 사례에서 평가 시나리오까지
본 연구는 AI 평가의 일관성과 신뢰성을 높이기 위해 '사과와 오렌지' 비교 문제를 해결하는 방법론을 제시합니다. 핵심은 구조화된 AI 사용 사례 워크시트를 활용하여 주제 전문가(SMEs)로부터 실제 산업 기반의 상세한 AI 사용 시나리오를 도출하고, 이를 LLM 프롬프팅과 인간 검토가 결합된 3단계 확장 파이프라인으로 변환하는 반복 가능한 프로세스를 구축하는 것입니다. 이 방법론은 금융 서비스 분야 사례를 통해 그 유용성을 입증하며, 운영 기반 마련(operational grounding)을 보장하여 보다 일관되고 의미 있는 인간 중심 AI 평가 패러다임을 지원합니다.
근사화가 필요 없는 미분 가능한 사선 결정 트리
본 기술 기사는 해석 가능성이 높아 의료 진단 등 안전 필수 도메인에서 유용한 결정 트리(DTs)의 한계점을 다루며, 특히 사선 결정 트리를 학습시키는 어려움을 지적합니다. 기존 연구들이 확률적 경계 부드럽게 하기나 STE 같은 근사화 기법에 의존했던 것과 달리, 본 논문은 DTSemNet이라는 새로운 프레임워크를 제안하여 이러한 한계를 극복하고자 합니다. 이 방법론은 미분 가능한 공식화를 통해 사선 결정 트리를 학습시키며, 강화학습 환경의 정책까지 적용 범위를 확장합니다.
신념 함수를 이용한 통계적 추론: 설문조사
신념 함수는 불확실성을 수학적으로 다루는 강력한 프레임워크로, 특히 확률 분포 학습이 어려운 상황에서 유용합니다. 본 설문조사는 신념 함수 기반 추론 체인의 핵심 단계인 '추론'에 초점을 맞춥니다. 구체적으로 통계적 데이터로부터 어떻게 신념 측정값을 효과적으로 학습하고 이를 활용하는지에 대한 주요 기여들을 검토합니다.
AI 기반 할당의 한계: 알레아토릭 불확실성 하에서의 최적 스크리닝
본 연구는 머신러닝 기반의 예측적 자원 할당이 가진 근본적인 한계점, 즉 알레아토릭 불확실성을 해결할 수 없다는 점에 주목합니다. 따라서 스크리닝 단계와 알고리즘적 표적화 단계를 결합한 2단계 최적 할당 프레임워크를 제안합니다. 이 프레임워크는 자원을 가장 위험도가 높은 단위와 예측 모델의 한계(margin)에 있는 단위에 전략적으로 배분하여, 제한된 예산 하에서 할당 효율성을 극대화하는 방법을 제시합니다.
Text-to-CAD 평가를 위한 CADTests
Text-to-CAD(텍스트를 3D 모델로 변환)는 디자인 워크플로우에 혁신적 잠재력을 가지고 있지만, 이를 평가할 수 있는 체계적인 방법론이 부족했습니다. 본 논문은 입력 프롬프트가 요구하는 기하학적 및 위상적 제약 조건을 검증하는 자동 테스트 기반의 'CADTests'를 소개합니다. 나아가 CADTests를 활용하여 Text-to-CAD 모델을 포괄적으로 평가할 수 있는 최초의 벤치마크인 'CADTestBench'를 구축하고 공개했습니다.
자신감 너머: LLM의 성능 예측을 위한 자기 평가 재고찰
본 기사는 대규모 언어 모델(LLMs)의 신뢰성 평가에 대한 새로운 접근 방식을 제안합니다. 기존의 확률적 정확도 추정치나 단순한 '자신감' 지표가 LLM의 실제 성능을 예측하는 데 한계가 있음을 지적하며, 인간 심리학의 인지 평가 이론(cognitive appraisal theory)을 차용했습니다. 이에 따라 자신감 외 6가지 추가적인 평가 기반 차원을 도입하여 모델 자기 평가를 다차원적으로 분석하고, 이를 통해 LLM 실패를 더 효과적으로 예측할 수 있음을 입증합니다.
분할 정복: 객체 동시 발생(Object Co-occurrence)이 OOD 탐지 시 단순성 편향 완화에 도움을 줍니다
본 기사는 딥러닝 모델의 신뢰성 확보에 필수적인 Out-of-distribution (OOD) 탐지 문제를 다룹니다. 기존 OOD 탐지 방식들이 이미지의 풍부한 문맥 정보를 간과하고 단순성 편향으로 인해 근접 OOD 탐지에 어려움을 겪는 점을 지적합니다. 이에 따라, 인간 시각 시스템에서 영감을 받아 객체 동시 발생(Object Co-occurrence, OCO) 패턴을 포착하는 새로운 객체 중심 OOD 탐지 프레임워크를 제안합니다.
MPD$^2$-Router: 녹내장 선별 및 진단을 위한 마스크 인식 다중 전문가 사전 정규화 이중 헤드 지연 라우터
MPD$^2$-Router는 녹내장 선별 및 진단을 위한 새로운 마스크 인식 다중 전문가 사전 정규화 이중 헤드 지연 라우터 프레임워크입니다. 이는 기존의 표준 공식들이 간과했던 전문가 가용성, 판독자 행동의 이질성, 작업 부하 불균형 등 복잡한 현실적 제약들을 고려하여 안과 분류(ophthalmic triage)를 재구성합니다. MPD$^2$-Router는 샘플별 가용성을 엄격하게 강제하는 마스크 인식 Gumbel--sigmoid 게이팅과 이중 헤드 지연/할당 정책을 결합하여, 어려운 사례를 가장 적절한 전문가에게 안전하게 라우팅하는 것을 목표로 합니다.
희소 컨텍스트-상태 믿음 전파를 이용한 정확한 가변 차수 정규 제약 변수 순서 마르코프 생성
본 연구는 희소 컨텍스트-상태 믿음 전파를 활용하여 가변 차수 마르코프 모델에 정규 제약 조건을 정확하게 적용하는 방법을 제시합니다. 기존의 방법들이 1차 마르코프 체인에 국한되었던 한계를 넘어, 생성기가 가변 차수/백오프 모델일 때 필요한 상태 공간을 식별하고 믿음 전파 추론을 수행할 수 있도록 확장했습니다. 이는 복잡한 언어 구조와 제약 조건을 동시에 만족시키며 시퀀스를 생성하는 데 기여합니다.
딥 네트워크의 스펙트럴 다이내믹스: 피처 학습, 아웃라이어 이탈 및 학습률 전이
본 논문은 확률적 경사 하강법으로 학습되는 넓은 신경망의 숨겨진 가중치 스펙트럼 변화를 연구하며, 특히 벌크(bulk)와 아웃라이어(outlier) 스펙트럴 다이내믹스를 공동 추적하는 2단계 동역학 평균장 이론(DMFT)을 개발했습니다. 이 프레임워크는 무한 너비의 비선형 네트워크와 고차원 극한의 깊은 선형 네트워크 두 가지 설정에 적용되었습니다. 연구 결과, 아웃라이어 스펙트럼이 훈련 시간, 네트워크 너비, 출력 스케일 등 다양한 매개변수에 따라 어떻게 진화하는지 예측할 수 있음을 보여줍니다.
이 피드 구독하기
본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.