본문으로 건너뛰기

Home About Portfolio Blog Insights Resume Contact

Home About Portfolio Blog Insights Resume Contact

© 2026 Molayo

Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

© 2026. Molayo. All rights reserved.

개인정보 처리방침|이용약관

Home About Portfolio Blog Insights Resume Contact

Home About Portfolio Blog Insights Resume Contact

© 2026 Molayo

Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

이 피드 구독하기

RSSFeedly, Inoreader 등으로 구독

API/api/search?q=검색어

AIllms.txt로 AI 크롤링 가이드

본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.

© 2026. Molayo. All rights reserved.

개인정보 처리방침|이용약관

다회차 LLM 대화에서 나타나는 어트랙터 상태 (Attractor States)

LLM 간의 다회차 대화에서 나타나는 '어트랙터(Attractor)' 현상을 연구한 논문입니다. 모델 간 상호작용 시 특정 모델의 스타일이 다른 모델에게 전이되어 대화가 특정 행동 집합으로 수렴하는 비대칭적 역학을 분석했습니다.

모호성 하에서의 불확실성 인지 생성 및 의사결정

본 연구는 베이지안 의사결정 이론과 위험 회피적 의사결정을 활용하여 LLM의 불확실성 인지 능력을 개선하는 알고리즘을 제안합니다. 튜터링 및 자동 동료 검토 작업에서 일치 예측(conformal prediction)을 통해 출력의 신뢰성을 높이는 방법을 다룹니다.

Dev.to헤드라인

중국산 오픈 모델을 통해 AI 벤더 종속(Vendor Lock-In)에서 벗어나기

OpenAI와 같은 폐쇄형 모델의 높은 비용과 벤더 종속성에서 벗어나기 위한 대안으로 중국산 오픈 웨이트 모델들을 비교 분석합니다. DeepSeek, Qwen, Kimi, GLM의 성능, 가격, 라이선스 및 OpenAI 호환성을 검토합니다.

Dev.to헤드라인

Ford의 AI 품질 검사 실패로 인해 300명의 엔지니어 복귀

Ford가 AI 품질 검사 시스템의 한계로 인해 300명 이상의 숙련된 엔지니어를 재고용했습니다. AI가 인간의 노하우를 충분히 학습하지 못해 발생한 운영상의 공백을 메우기 위한 조치입니다.

Qiita헤드라인

Karpathy의 Claude 코딩 소회에서 탄생한 4원칙 — CLAUDE.md 한 장으로 diff의 폭주를 막는 시도

확신에 찬 듯하지만 틀릴 수 있는 AI의 답변을 넘어선 새로운 접근법

AI의 단일 답변이 가진 불확실성을 해결하기 위해 여러 AI 모델이 토론하는 'Council of High Intelligence' 방식을 소개합니다. 다양한 페르소나와 모델을 활용해 다각도의 논의를 이끌어냄으로써 더 깊이 있는 통찰을 제공합니다.

침투 테스트의 정보 수집, 취약점 탐색, 검증, 보고서 작성 과정을 자동화하는 AI 기반 오픈소스 도구 VulnClaw

VulnClaw는 자연어로 명령하여 침투 테스트의 전 과정을 자동화하는 AI 기반 오픈소스 도구입니다. 정보 수집부터 취약점 탐색, 공격 검증, 보고서 작성 및 Python PoC 생성까지 지원합니다.

접종 어댑터 (Inoculation Adapters): 더 적은 놀라운 백도어를 통한 능력의 선택적 일반화 개선

창발적 정렬 불량에 대응하기 위해 LoRA 기반의 접종 어댑터(Inoculation Adapters) 기술을 제안합니다. 이 방식은 원치 않는 특성을 억제하면서도 기존 프롬프팅 방식보다 백도어 생성 위험을 낮추고 억제 효과를 높였습니다.

TRACE: 이자 간 음성 대화에서의 시간적 관계 인지적 감정 동조 탐지

음성 AI 에이전트의 감정 동조(Emotional Entrainment)를 탐지하기 위한 새로운 데이터셋 DyadEE와 프레임워크 TRACE를 제안합니다. TRACE는 음향 임베딩의 순차적 시퀀스를 활용하여 대화 맥락과 관계 정보를 통합 모델링합니다.

Qwen, Hugging Face에 오픈 소스 음성 인식 모델 출시

Qwen이 52개 언어와 방언을 지원하는 오픈 소스 음성 인식 모델 Qwen3-ASR을 Hugging Face에 출시했습니다. 1.7B 파라미터 규모임에도 폐쇄형 API와 경쟁하는 SOTA 성능을 보여주며, Transformers 환경에서 네이티브로 실행됩니다.

SingGuard: 멀티모달 AI를 위한 런타임 정책 기반 가드레일 (guardrails)

SingGuard는 멀티모달 AI의 안전성을 위해 런타임 정책 기반의 가드레일을 제안하는 연구입니다. 텍스트와 이미지를 포함한 교차 모달 콘텐츠를 빠른/느린 추론 방식으로 판별하며, 다양한 데이터셋에서 SOTA 성능을 달성했습니다.

Dev.to헤드라인

모델 이름이 아닌 예산으로 AI 기능을 설계하기

AI 기능을 구현할 때 특정 모델 이름에 의존하지 않고, 서비스 목표(품질, 지연 시간, 비용)를 기준으로 설계하는 추상화 방식을 제안합니다. 이를 통해 모델 변경이나 비용 변동에 유연하게 대응할 수 있는 지속 가능한 아키텍처를 구축할 수 있습니다.

Clarus: 웹 규모의 과학적 협업을 향한 자율 연구 에이전트의 조정

Clarus는 자율 연구 에이전트가 단순 보조를 넘어 프로젝트와 자원을 조정하는 협업 인프라를 제안합니다. 연구를 개방적이고 감사 가능한 다단계 프로세스로 재정의하며, 네 가지 계층을 통해 과학적 협업을 조직합니다.

Dev.to헤드라인

Hermes Memory Installer: 새로운 스냅샷 압축 및 복구 헬퍼(Helpers)

Hermes Memory Installer가 대규모 분산 시스템의 메모리 스냅샷을 효율적으로 관리하기 위한 압축 및 복구 헬퍼 기능을 출시했습니다. Zstd와 LZ4 알고리즘을 지원하여 스토리지와 네트워크 부담을 줄이고, 네이티브 메모리를 활용해 GC 압력을 최소화합니다.

EMPATH: 정서 지원 챗봇의 안전성 평가를 위한 다국어 감사자-판사(Auditor-Judge) 벤치마크

정서 지원 챗봇의 안전성을 다국어 및 다중 턴 환경에서 평가하기 위한 새로운 벤치마크인 EMPATH를 제안합니다. 감사자-판사(Auditor-Judge) 프레임워크를 통해 위기 대응 및 정서적 안전성을 정밀하게 측정합니다.

PromptGNN-sim: 텍스트 속성 그래프 학습을 위한 GNN과 LLM의 심층 융합 및 정렬

PromptGNN-sim은 텍스트 속성 그래프(TAGs) 학습을 위해 GNN과 LLM을 양방향으로 융합하는 새로운 프레임워크를 제안합니다. 구조적 어텐션과 텍스트 유사성을 결합하여 구조 인지 프롬프트를 생성하며, 대조 학습을 통해 모달리티 간의 심층적인 상호작용을 최적화합니다.

무해한 샘플 속에 숨겨진 유해한 감독(Supervision)에 대한 방어

무해한 학습 샘플 내에 유해한 감독 신호를 숨기는 '임베디드 공격'의 위험성을 분석하고, 이를 방어하기 위한 새로운 학습 기법을 제안합니다. 기존 가드레일의 한계를 지적하며 토큰 수준의 정규화를 활용한 DR-SFT 방식을 소개합니다.

ManimAgent: 시각적 교육을 위한 자기 진화형 멀티모달 에이전트 (Self-Evolving Multimodal Agents for

ManimAgent는 수학 애니메이션 생성을 위해 Manim 라이브러리를 사용하는 자기 진화형 멀티모달 에이전트입니다. 이중 채널 에피소드 메모리 뱅크를 통해 성공 사례와 실패 패턴을 작업 간에 전달하며 지속적으로 성장합니다.

Always-OnAgents: LLM 에이전트의 지속적 메모리, 상태 및 거버넌스에 관한 조사

LLM 에이전트가 지속적인 상태(durable state)를 유지하고 관리하기 위한 거버넌스 체계를 조사한 연구입니다. 메모리, 권한, 감사 기록 등 상태의 생애주기를 분석하고, 상태 변이 및 복구 능력을 평가하는 새로운 프로토콜(AOEP-v0)을 제안합니다.

UKRI 연구 지원 제안서에서의 연구 엔티티 추출 및 주제 탐지

UKRI 연구 지원 제안서에서 연구 엔티티를 추출하고 주제를 탐지하기 위해 GPT-4o, Mistral, DSIT-Taxonomies의 성능을 비교한 연구입니다. Mistral 기반 방식이 기존 방식보다 높은 주제 분류 정확도와 운영 효율성을 보임을 입증했습니다.

이전71 / 2605다음

Andrej Karpathy의 Claude 코딩 경험을 바탕으로 LLM의 오류를 방지하는 4원칙(Think, Simple, Surgical, Goal)과 이를 구현한 CLAUDE.md 설정 가이드를 소개합니다. Claude Code와 Cursor 사용 시 발생하는 과도한 코드 변경(diff) 문제를 해결하는 실무적인 접근법을 다룹니다.

1일 전0