Insights
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
CTPA 및 의료 기록을 통한 폐색전증 위험 계층화: 혈관 그래프가 전부가 아니다
폐색전증(PE) 위험 계층화를 위해 의료 기록과 CTPA 이미지 데이터를 활용한 다양한 모델 성능을 벤치마킹한 연구입니다. 연구 결과, 혈관 그래프를 활용한 GNN 모델보다 의료 기록과 심장 바이오마커를 포함한 정형 데이터 모델의 성능이 더 우수함을 확인했습니다.
SE-AGCNet: 회의 시나리오에서의 음성 향상 (Speech Enhancement) 및 라우드니스 제어 (Loudness Control)
음성 향상(SE)과 자동 이득 제어(AGC)를 별개로 처리하던 기존 방식의 한계를 극복하기 위해, 두 과정을 통합 최적화하는 엔드 투 엔드 프레임워크 SE-AGCNet을 제안합니다. 회의 시나리오에서 음성 품질과 라우드니스 제어를 동시에 개선하여 ASR 정확도를 높였습니다.
지난 일주일 동안 Claude와 함께 Unreal Engine 5.8의 새로운 네이티브 MCP를 테스트했습니다.
Unreal Engine 5.8의 새로운 네이티브 MCP를 Claude와 함께 테스트한 결과입니다. PCG, 씬 제어, 오브젝트 배치 등에서 강력한 성능을 보였으나, 최상의 결과를 위해서는 Free Vibe UE 플러그인과의 결합이 필요함을 확인했습니다.
압축기로서의 에이전트 시스템: 비트(Bits) 단위로 측정하는 시스템 지능
에이전트 시스템의 지능을 '압축 능력'으로 정의하고, 이를 비트(bits) 단위로 측정하는 새로운 분석적 관점을 제시합니다. 다양한 실험을 통해 에이전트 구성 요소가 데이터의 코드 길이를 줄임으로써 지능을 향상시킨다는 것을 입증했습니다.
WinDOM: 소형 모델 GUI Grounding을 위한 Self-Family Distillation
소형 GUI grounding 에이전트의 성능 향상을 위해 Self-Family Distillation(SFD) 기법을 제안합니다. 인간의 주석 없이 DOM 데이터를 활용해 학습 데이터를 구축하고, 강화학습(GRPO)과 결합하여 소형 모델의 성능을 극대화합니다.
도움이 되는가 아니면 해로운가? 인간 연구를 통한 LLM 지원 취약점 패칭 평가
LLM이 소프트웨어 취약점 패칭 과정에서 속도를 높일 수 있는지, 아니면 보안상 위험한 코드를 생성하는지 인간 참여자 실험을 통해 검증합니다. 기능적 테스트는 통과하지만 보안 검증에는 실패하는 피상적 수정의 위험성을 중점적으로 다룹니다.
팀 및 목표 조건부 강화학습 (RL)과 인수분해된 분기 한정법 (Factorized Branch-and-Bound)을 이용한 다중 에이전트
다중 에이전트의 팀 구성과 목표를 추론하는 과정에서 발생하는 조합론적 폭발 문제를 해결하기 위한 새로운 연구를 소개합니다. 인수분해된 분기 한정법(MAGR-BB)을 통해 탐색 효율을 극대화하면서도 정확한 가설 순위를 제공합니다.

Anthropic이 모든 사람을 위해 전문적인 AI 교육을 무료로 제공합니다.
Anthropic이 MCP, API, Claude Code 등을 다루는 실무 중심의 무료 교육 플랫폼 'Anthropic Academy'를 출시했습니다. 개발자와 초보자를 대상으로 실제 사용 사례와 실습을 통해 AI 모델 활용 능력을 키울 수 있는 13개의 코스를 제공합니다.
Microsoft의 새로운 논문 'Less Context, Better Agents': 에이전트에게는 더 적은 컨텍스트가 더 낫다
Microsoft의 새로운 논문 'Less Context, Better Agents'는 에이전트의 성능 향상을 위해 컨텍스트를 무조건 늘리는 대신 최적화된 축소가 필요함을 증명합니다. 실험 결과, 가벼운 요약을 활용했을 때 가장 높은 작업 완료율을 기록했습니다.
재시도(Retry)가 왜 자가 치유(Self-Healing)가 아닌가: LLM API를 위한 기술적 심층 분석
단순한 재시도(Retry) 로직은 진정한 자가 치유(Self-Healing)가 아니며, LLM API의 오류를 근본적으로 해결하지 못합니다. 진정한 자가 치유를 위해서는 계약 검증, 검증된 장애 조치, 드리프트 탐지 능력을 갖춘 아키텍처가 필요합니다.
Anthropic의 Mythos AI, 단 몇 시간 만에 미국 정부 기밀 시스템 침투
Anthropic의 Mythos AI가 정부 승인 테스트를 통해 단 몇 시간 만에 미국 정부 기밀 시스템의 취약점을 식별했습니다. 이는 AI가 고도의 공격적 사이버 능력을 갖출 수 있음을 보여주는 사례입니다.
형식적 사고의 직조 (Weave of Formal Thought)
LLM의 코드 생성 시 구문적 유효성을 보장하기 위해 형식 엔진과 학습된 구조적 표현을 결합한 WoFT 프레임워크를 제안합니다. GLR 파싱 기반의 제약된 디코딩과 잠재 변수 미세 조정을 통해 모델이 문법 구조를 직접 활용하도록 설계되었습니다.
SpeechEQ: 사회적 인지 능력을 갖춘 음성 대화 모델의 정서 지능 지수(EQ) 벤치마킹
Speech-Language Models(SLMs)의 사회적 인지 능력을 평가하기 위한 새로운 벤치마크 프레임워크인 SpeechEQ를 소개합니다. 기존 평가 방식의 한계를 넘어 다회차 대화에서의 교차 모달 추론 능력을 측정하며, 현재 멀티모달 모델들이 겪는 기술적 병목 현상을 분석합니다.
Autodata: 고품질 합성 데이터(Synthetic Data)를 생성하는 에이전트형 데이터 과학자
고품질 합성 데이터를 생성하는 에이전트형 데이터 과학자 방법론인 Autodata를 소개합니다. 에이전트형 셀프 인스트럭트와 메타 최적화 기법을 통해 기존 방식보다 뛰어난 성능의 데이터를 구축할 수 있음을 입증했습니다.
신경망 압축을 위한 계층적 강화학습 (HiReLC): 가지치기 (Pruning) 및 양자화 (Quantization)
심층 신경망의 자동화된 양자화 및 가지치기를 위한 계층적 강화학습 프레임워크인 HiReLC를 제안합니다. 저수준과 고수준 에이전트가 협력하여 커널 설정과 전역 예산을 최적화하며, 대리 모델을 통해 계산 효율성을 높였습니다.
다인수 불완전 정보 게임의 Nash equilibrium 계산을 위한 변수 범위 축소 (Variable Bound Tightening)
다인수 불완전 정보 게임에서 Nash equilibrium을 정확하게 계산하기 위한 새로운 접근 방식을 제안합니다. 비선형 상보성 문제 정식화와 변수 범위 축소(Variable Bound Tightening)를 통해 계산 효율성을 높이고 볼록 완화를 강화하는 방법을 다룹니다.
MedGuards: 신뢰할 수 있는 의료 오류 탐지 및 수정을 위한 멀티 에이전트 시스템
의료 분야 LLM의 오류를 탐지하고 수정하기 위한 멀티 에이전트 프레임워크인 MedGuards를 제안합니다. 인컨텍스트 학습과 신뢰도 기반 중재 메커니즘을 통해 추가 학습 없이도 높은 정확도와 해석 가능성을 제공합니다.
FORCE: 가치 보정 웜업(Value-Calibrated Warm-up) 및 자기 증류(Self-Distillation)를 통한 효율적인
VLA 모델의 미세 조정 시 발생하는 불안정한 Q-함수와 낮은 샘플 효율성 문제를 해결하기 위한 3단계 프레임워크 FORCE를 제안합니다. 가치 보정 웜업과 자기 증류 기술을 통해 학습 안정성을 높이고 인간의 개입 없이도 높은 성공률을 달성했습니다.
표 형식 파운데이션 모델(Tabular Foundation Models)의 어텐션 레이어(Attention Layers)에 존재하는 프라이버시
표 형식 파운데이션 모델의 어텐션 메커니즘이 민감한 데이터를 유출하여 멤버십 추론 공격(MIA)을 가능하게 함을 입증했습니다. 이를 방어하기 위해 모델 재학습 없이도 유출을 줄이는 추론 시점 방어 기법을 제안합니다.
Web4 에이전트 경제: 지형, 과제 및 기회에 관한 대규모 실증 연구
자율 에이전트가 경제 주체로 활동하는 Web4 생태계의 현황과 인프라 과제를 분석한 대규모 실증 연구입니다. 수억 건의 트랜잭션과 MCP 프로젝트 등을 분석하여 기계 간 결제 경제의 성장과 인프라의 미성숙함을 규명했습니다.
이 피드 구독하기
본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.