Insights
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
© 2026 Molayo
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.

Qwen이 52개 언어와 방언을 지원하는 오픈 소스 음성 인식 모델 Qwen3-ASR을 Hugging Face에 출시했습니다. 1.7B 파라미터 규모임에도 폐쇄형 API와 경쟁하는 SOTA 성능을 보여주며, Transformers 환경에서 네이티브로 실행됩니다.

SingGuard는 멀티모달 AI의 안전성을 위해 런타임 정책 기반의 가드레일을 제안하는 연구입니다. 텍스트와 이미지를 포함한 교차 모달 콘텐츠를 빠른/느린 추론 방식으로 판별하며, 다양한 데이터셋에서 SOTA 성능을 달성했습니다.
AI 기능을 구현할 때 특정 모델 이름에 의존하지 않고, 서비스 목표(품질, 지연 시간, 비용)를 기준으로 설계하는 추상화 방식을 제안합니다. 이를 통해 모델 변경이나 비용 변동에 유연하게 대응할 수 있는 지속 가능한 아키텍처를 구축할 수 있습니다.
Clarus는 자율 연구 에이전트가 단순 보조를 넘어 프로젝트와 자원을 조정하는 협업 인프라를 제안합니다. 연구를 개방적이고 감사 가능한 다단계 프로세스로 재정의하며, 네 가지 계층을 통해 과학적 협업을 조직합니다.
Hermes Memory Installer가 대규모 분산 시스템의 메모리 스냅샷을 효율적으로 관리하기 위한 압축 및 복구 헬퍼 기능을 출시했습니다. Zstd와 LZ4 알고리즘을 지원하여 스토리지와 네트워크 부담을 줄이고, 네이티브 메모리를 활용해 GC 압력을 최소화합니다.
정서 지원 챗봇의 안전성을 다국어 및 다중 턴 환경에서 평가하기 위한 새로운 벤치마크인 EMPATH를 제안합니다. 감사자-판사(Auditor-Judge) 프레임워크를 통해 위기 대응 및 정서적 안전성을 정밀하게 측정합니다.
PromptGNN-sim은 텍스트 속성 그래프(TAGs) 학습을 위해 GNN과 LLM을 양방향으로 융합하는 새로운 프레임워크를 제안합니다. 구조적 어텐션과 텍스트 유사성을 결합하여 구조 인지 프롬프트를 생성하며, 대조 학습을 통해 모달리티 간의 심층적인 상호작용을 최적화합니다.
무해한 학습 샘플 내에 유해한 감독 신호를 숨기는 '임베디드 공격'의 위험성을 분석하고, 이를 방어하기 위한 새로운 학습 기법을 제안합니다. 기존 가드레일의 한계를 지적하며 토큰 수준의 정규화를 활용한 DR-SFT 방식을 소개합니다.
ManimAgent는 수학 애니메이션 생성을 위해 Manim 라이브러리를 사용하는 자기 진화형 멀티모달 에이전트입니다. 이중 채널 에피소드 메모리 뱅크를 통해 성공 사례와 실패 패턴을 작업 간에 전달하며 지속적으로 성장합니다.
LLM 에이전트가 지속적인 상태(durable state)를 유지하고 관리하기 위한 거버넌스 체계를 조사한 연구입니다. 메모리, 권한, 감사 기록 등 상태의 생애주기를 분석하고, 상태 변이 및 복구 능력을 평가하는 새로운 프로토콜(AOEP-v0)을 제안합니다.
UKRI 연구 지원 제안서에서 연구 엔티티를 추출하고 주제를 탐지하기 위해 GPT-4o, Mistral, DSIT-Taxonomies의 성능을 비교한 연구입니다. Mistral 기반 방식이 기존 방식보다 높은 주제 분류 정확도와 운영 효율성을 보임을 입증했습니다.
전기차 온보드 충전기(OBC)의 전력망 고조파 문제를 해결하기 위해 듀티 사이클 예측 MPCC 기법을 제안합니다. 실시간 고조파 추정 참조를 통합하여 기존 MPCC의 한계를 극복하고 전류 품질을 크게 개선했습니다.
Neural ODE를 활용하여 희소하고 불규칙한 종단적 데이터를 처리하는 ENC-ODE 모델을 제안합니다. 이 모델은 진단 조건부 연속 역학을 통해 알츠하이머병과 같은 신경퇴행성 질환의 바이오마커 변화를 정밀하게 예측합니다.
표 형식 데이터(Tabular Data)를 위한 파운데이션 모델의 일반화 능력을 평가하기 위해 통합 벤치마크인 BeyondArena를 제안합니다. 기존 벤치마크가 IID 데이터에 치중된 한계를 극복하고, 비-IID 및 고차원 데이터에서의 모델 성능을 다각도로 분석합니다.
LLM을 활용한 자원 배분 및 우선순위 결정 시 판단의 일관성을 측정하는 방법론을 다룹니다. 토너먼트 그래프의 순환 삼항 관계를 이용한 내적 일관성과 Kendall의 τ를 이용한 외적 변동성 측정을 통해 LLM 심판의 신뢰도를 평가하는 가이드라인을 제시합니다.
녹내장 시야(VF) 예측 시 발생하는 불확실성을 해결하기 위해 조건부 디노이징 확산 모델을 제안합니다. 기존의 결정론적 점 추정 방식 대신 확률적 분포를 생성하여 임상적으로 유의미한 정확도와 보정된 예측을 제공합니다.
Transformer 아키텍처가 측도론적 커널 프레임워크 내에서 베이즈 사후 추론을 구현함을 수학적으로 증명합니다. QKV 및 attention 메커니즘이 베이즈 결합 분포 조건을 충족할 때 순전파 계산이 엄격한 베이즈 업데이트와 동일함을 보입니다.
LLM을 활용하여 자연어 요구사항을 멀티 에이전트 시스템(MAS) 검증을 위한 ATL/ATL* 정식 명세로 번역하는 프레임워크를 제안합니다. 전문가 검증 데이터셋을 통해 미세 조정된 소규모 오픈 웨이트 모델이 독점 API 모델과 대등한 성능을 보임을 입증했습니다.
데이터 중심의 확장 원칙인 '쓰라린 교훈'을 재검토하며, 피드백 정보 루프(FIL)가 긴 도메인에서의 한계를 지적합니다. 인간의 지식을 활용한 귀납적 편향(Inductive Biases)을 통합하는 것이 GPU 프로그래밍과 같은 환경에서 더 우수한 성능을 보임을 입증합니다.
LLM 에이전트가 사회 시스템 시뮬레이션에서 인간의 협력 역학을 얼마나 충실히 재현하는지 연구했습니다. 연구 결과, LLM 집단은 거시적 수준의 협력 패턴은 인간과 유사하게 나타내지만, 개별 수준의 이질성과 의사결정 규칙에서는 인간과 차이를 보이는 '거시-미시적 해리' 현상이 발견되었습니다.