Insights
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
© 2026 Molayo
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.
녹내장 시야(VF) 예측 시 발생하는 불확실성을 해결하기 위해 조건부 디노이징 확산 모델을 제안합니다. 기존의 결정론적 점 추정 방식 대신 확률적 분포를 생성하여 임상적으로 유의미한 정확도와 보정된 예측을 제공합니다.
Transformer 아키텍처가 측도론적 커널 프레임워크 내에서 베이즈 사후 추론을 구현함을 수학적으로 증명합니다. QKV 및 attention 메커니즘이 베이즈 결합 분포 조건을 충족할 때 순전파 계산이 엄격한 베이즈 업데이트와 동일함을 보입니다.
LLM을 활용하여 자연어 요구사항을 멀티 에이전트 시스템(MAS) 검증을 위한 ATL/ATL* 정식 명세로 번역하는 프레임워크를 제안합니다. 전문가 검증 데이터셋을 통해 미세 조정된 소규모 오픈 웨이트 모델이 독점 API 모델과 대등한 성능을 보임을 입증했습니다.
데이터 중심의 확장 원칙인 '쓰라린 교훈'을 재검토하며, 피드백 정보 루프(FIL)가 긴 도메인에서의 한계를 지적합니다. 인간의 지식을 활용한 귀납적 편향(Inductive Biases)을 통합하는 것이 GPU 프로그래밍과 같은 환경에서 더 우수한 성능을 보임을 입증합니다.
LLM 에이전트가 사회 시스템 시뮬레이션에서 인간의 협력 역학을 얼마나 충실히 재현하는지 연구했습니다. 연구 결과, LLM 집단은 거시적 수준의 협력 패턴은 인간과 유사하게 나타내지만, 개별 수준의 이질성과 의사결정 규칙에서는 인간과 차이를 보이는 '거시-미시적 해리' 현상이 발견되었습니다.
구조화된 메타데이터 검색 시 필드 순서에 따라 검색 품질이 변하는 문제를 해결하기 위해 순열 불변(Permutation-Invariant) 미세 조정 기법인 PI-FT를 제안합니다. 이 방식은 필드 위치가 아닌 레이블에 의미를 결합하여 순서 변경에 따른 성능 저하를 최소화합니다.
COHORT는 기업 네트워크 공격 완화 절차를 자동화하는 최초의 엔드투엔드 멀티 에이전트 LLM 프레임워크입니다. GNS3 에뮬레이터 상에서 공격적 재현을 통해 생성된 보안 정책을 검증하며, 기존 싱글 에이전트 방식보다 4.4배 높은 방어 성공률을 기록했습니다.
현재 LLM의 한계를 지적하며 인공 초지능(ASI) 달성을 위한 핵심 요소로 '상황 인지' 능력을 제안합니다. 추상적 예측, 장기 압축 메모리, 능동적 학습을 통해 내부 시뮬레이션 내에서 행동하는 능력이 필요함을 강조합니다.
심층 신경망의 일반화 원리를 정보 이론, 위상수학, 통계 역학을 결합하여 분석한 연구입니다. 샤논-위상 병목 현상 정리를 통해 학습 가능성의 한계를 정의하고, 그로킹 현상을 엔트로피 방출 관점에서 설명합니다.
SIMAX는 임상의와 환자 간의 대화를 시뮬레이션하여 대규모의 주석이 달린 데이터를 생성하는 프레임워크입니다. 사전 정의된 시나리오와 페르소나를 통해 통제된 대화 데이터를 생성함으로써, 커뮤니케이션 코딩 시스템의 개발과 검증을 위한 데이터 기반을 제공합니다.
이질적인 Helmholtz 방정식을 효율적으로 풀기 위한 학습된 위상 공간 멀티그리드 프리컨디셔너인 McMg를 제안합니다. 물리적 공간을 조립하면서도 채널 차원을 통해 국부적 파동 정보를 유지하여 수치적 정확도와 계산 효율성을 높였습니다.
사후 개념 병목 모델(Post-Hoc CBMs)에서 예측 정확도가 개념의 의미론적 유의미성을 보장하지 못하는 문제를 분석합니다. 공변량 변화와 라벨 노이즈로 인한 불충실한 개념 표현 사례를 식별하고, 이를 평가하기 위한 새로운 지표를 제안합니다.
도구 증강 에이전트가 올바른 도구를 선택하더라도 잘못된 외부 엔티티를 대상으로 동작하는 '엔티티 바인딩 실패' 문제를 연구합니다. 본 논문은 이 문제를 신뢰성 및 안전성 측면에서 분석하고, 이를 해결하기 위한 엔티티 인식 실행 메커니즘을 제안합니다.
자율 주행 정책이 자신의 실수를 통해 지속적으로 학습할 수 있도록 돕는 R²LPL 프레임워크를 제안합니다. 이 방식은 폐쇄 루프 환경에서의 실수를 교정 가능한 지식으로 변환하여, 기존 지식을 유지하면서도 롱테일 시나리오에 대한 대응 능력을 강화합니다.
에이전트의 움직임과 환경 변화가 혼재된 모호한 상황에서 잠재 행동을 효과적으로 학습하기 위한 OTF-LAM 모델을 제안합니다. 관측 전이를 희소한 프리미티브 세트로 분해하여 행동과 유사한 잠재 변수를 더욱 견고하게 추출합니다.
AI 코드 완성 도구 사용 시 학생들의 비판적 참여도를 측정하기 위한 연구를 소개합니다. 새로운 도구인 Clover를 통해 행동 상호작용 지표를 개발하고, 탭 수락 비율과 체류 시간이 성찰적 참여에 미치는 영향을 분석했습니다.
멀티 에이전트 시스템(MAS)에서 에이전트의 역량을 텍스트 기반 프록시가 아닌 능동적 테스트로 검증하는 ANTAP 아키텍처를 제안합니다. ANTAP은 비텍스트적 대수적 투영을 통해 에이전트의 실제 능력을 추출하여, 설명 조작이나 백도어를 통한 보안 공격을 효과적으로 방어합니다.
코딩 에이전트의 효율적인 LLM 서빙을 위해 실제 사용 패턴을 분석한 TraceLab 연구를 소개합니다. Claude Code와 Codex의 트레이스를 분석하여 긴 자율 루프와 긴 컨텍스트 등 코딩 에이전트 특유의 워크로드 특성을 규명했습니다.
창의적 AI 평가 시 전문가 간의 의견 불일치를 노이즈가 아닌 취향의 차이로 보는 새로운 벤치마크인 HCB를 제안합니다. 수렴(기술적 정확성)과 발산(미적 취향) 신호를 모두 보존하여 모델의 성능을 다각도로 측정합니다.
악성코드 분류, 패킹 탐지, 패밀리 귀속을 동시에 수행하는 MoE 기반 멀티태스크 프레임워크를 제안합니다. MMoE 아키텍처를 활용하여 다양한 입력 표현에 대응하며, 변이된 샘플에 대해서도 높은 탐지율과 강건성을 입증했습니다.