Insights
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
© 2026 Molayo
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.
LLM 간의 다회차 대화에서 나타나는 '어트랙터(Attractor)' 현상을 연구한 논문입니다. 모델 간 상호작용 시 특정 모델의 스타일이 다른 모델에게 전이되어 대화가 특정 행동 집합으로 수렴하는 비대칭적 역학을 분석했습니다.
본 연구는 베이지안 의사결정 이론과 위험 회피적 의사결정을 활용하여 LLM의 불확실성 인지 능력을 개선하는 알고리즘을 제안합니다. 튜터링 및 자동 동료 검토 작업에서 일치 예측(conformal prediction)을 통해 출력의 신뢰성을 높이는 방법을 다룹니다.
OpenAI와 같은 폐쇄형 모델의 높은 비용과 벤더 종속성에서 벗어나기 위한 대안으로 중국산 오픈 웨이트 모델들을 비교 분석합니다. DeepSeek, Qwen, Kimi, GLM의 성능, 가격, 라이선스 및 OpenAI 호환성을 검토합니다.
Ford가 AI 품질 검사 시스템의 한계로 인해 300명 이상의 숙련된 엔지니어를 재고용했습니다. AI가 인간의 노하우를 충분히 학습하지 못해 발생한 운영상의 공백을 메우기 위한 조치입니다.


AI의 단일 답변이 가진 불확실성을 해결하기 위해 여러 AI 모델이 토론하는 'Council of High Intelligence' 방식을 소개합니다. 다양한 페르소나와 모델을 활용해 다각도의 논의를 이끌어냄으로써 더 깊이 있는 통찰을 제공합니다.

VulnClaw는 자연어로 명령하여 침투 테스트의 전 과정을 자동화하는 AI 기반 오픈소스 도구입니다. 정보 수집부터 취약점 탐색, 공격 검증, 보고서 작성 및 Python PoC 생성까지 지원합니다.
창발적 정렬 불량에 대응하기 위해 LoRA 기반의 접종 어댑터(Inoculation Adapters) 기술을 제안합니다. 이 방식은 원치 않는 특성을 억제하면서도 기존 프롬프팅 방식보다 백도어 생성 위험을 낮추고 억제 효과를 높였습니다.
음성 AI 에이전트의 감정 동조(Emotional Entrainment)를 탐지하기 위한 새로운 데이터셋 DyadEE와 프레임워크 TRACE를 제안합니다. TRACE는 음향 임베딩의 순차적 시퀀스를 활용하여 대화 맥락과 관계 정보를 통합 모델링합니다.

Qwen이 52개 언어와 방언을 지원하는 오픈 소스 음성 인식 모델 Qwen3-ASR을 Hugging Face에 출시했습니다. 1.7B 파라미터 규모임에도 폐쇄형 API와 경쟁하는 SOTA 성능을 보여주며, Transformers 환경에서 네이티브로 실행됩니다.

SingGuard는 멀티모달 AI의 안전성을 위해 런타임 정책 기반의 가드레일을 제안하는 연구입니다. 텍스트와 이미지를 포함한 교차 모달 콘텐츠를 빠른/느린 추론 방식으로 판별하며, 다양한 데이터셋에서 SOTA 성능을 달성했습니다.
AI 기능을 구현할 때 특정 모델 이름에 의존하지 않고, 서비스 목표(품질, 지연 시간, 비용)를 기준으로 설계하는 추상화 방식을 제안합니다. 이를 통해 모델 변경이나 비용 변동에 유연하게 대응할 수 있는 지속 가능한 아키텍처를 구축할 수 있습니다.
Clarus는 자율 연구 에이전트가 단순 보조를 넘어 프로젝트와 자원을 조정하는 협업 인프라를 제안합니다. 연구를 개방적이고 감사 가능한 다단계 프로세스로 재정의하며, 네 가지 계층을 통해 과학적 협업을 조직합니다.
Hermes Memory Installer가 대규모 분산 시스템의 메모리 스냅샷을 효율적으로 관리하기 위한 압축 및 복구 헬퍼 기능을 출시했습니다. Zstd와 LZ4 알고리즘을 지원하여 스토리지와 네트워크 부담을 줄이고, 네이티브 메모리를 활용해 GC 압력을 최소화합니다.
정서 지원 챗봇의 안전성을 다국어 및 다중 턴 환경에서 평가하기 위한 새로운 벤치마크인 EMPATH를 제안합니다. 감사자-판사(Auditor-Judge) 프레임워크를 통해 위기 대응 및 정서적 안전성을 정밀하게 측정합니다.
PromptGNN-sim은 텍스트 속성 그래프(TAGs) 학습을 위해 GNN과 LLM을 양방향으로 융합하는 새로운 프레임워크를 제안합니다. 구조적 어텐션과 텍스트 유사성을 결합하여 구조 인지 프롬프트를 생성하며, 대조 학습을 통해 모달리티 간의 심층적인 상호작용을 최적화합니다.
무해한 학습 샘플 내에 유해한 감독 신호를 숨기는 '임베디드 공격'의 위험성을 분석하고, 이를 방어하기 위한 새로운 학습 기법을 제안합니다. 기존 가드레일의 한계를 지적하며 토큰 수준의 정규화를 활용한 DR-SFT 방식을 소개합니다.
ManimAgent는 수학 애니메이션 생성을 위해 Manim 라이브러리를 사용하는 자기 진화형 멀티모달 에이전트입니다. 이중 채널 에피소드 메모리 뱅크를 통해 성공 사례와 실패 패턴을 작업 간에 전달하며 지속적으로 성장합니다.
LLM 에이전트가 지속적인 상태(durable state)를 유지하고 관리하기 위한 거버넌스 체계를 조사한 연구입니다. 메모리, 권한, 감사 기록 등 상태의 생애주기를 분석하고, 상태 변이 및 복구 능력을 평가하는 새로운 프로토콜(AOEP-v0)을 제안합니다.
UKRI 연구 지원 제안서에서 연구 엔티티를 추출하고 주제를 탐지하기 위해 GPT-4o, Mistral, DSIT-Taxonomies의 성능을 비교한 연구입니다. Mistral 기반 방식이 기존 방식보다 높은 주제 분류 정확도와 운영 효율성을 보임을 입증했습니다.
Andrej Karpathy의 Claude 코딩 경험을 바탕으로 LLM의 오류를 방지하는 4원칙(Think, Simple, Surgical, Goal)과 이를 구현한 CLAUDE.md 설정 가이드를 소개합니다. Claude Code와 Cursor 사용 시 발생하는 과도한 코드 변경(diff) 문제를 해결하는 실무적인 접근법을 다룹니다.