본문으로 건너뛰기

© 2026 Molayo

Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

r/LocalLLaMA분석

Mac Studio에서의 GLM 5.2 속도 향상 PR

Mac Studio의 대용량 메모리를 활용하여 GLM 5.2 모델의 실행 속도를 대폭 향상시키는 PR이 공개되었습니다. 100k 이상의 긴 컨텍스트에서도 100 t/s 이상의 프리필 속도를 유지하며 효율적인 모델 실행이 가능합니다.

2일 전0
Yahoo Finance헤드라인

투자자들, 미-이란 진전 상황, PCE 인플레이션 데이터 및 연준 발언 주시하며 혼조세로 출발 예상

미국과 이란의 평화 협상 진전 및 PCE 인플레이션 데이터 발표를 앞두고 월스트리트가 혼조세로 출발할 전망입니다. 유가 변동과 국채 수익률 변화 속에서 투자자들은 연준의 발언과 주요 기업 실적에 주목하고 있습니다.

2일 전0
Yahoo Finance헤드라인

핵심 알파, 대규모 자본: Capital Group이 액티브 ETF 전략을 변화시킨 방법

Capital Group이 액티브 ETF 시장에 진입 4년 만에 운용 자산 1,500억 달러를 달성하며 업계 3위로 성장했습니다. 전통적인 펀더멘털 액티브 운용 방식을 ETF에 접목하여 자문가들에게 차별화된 투자 전략을 제공하고 있습니다.

2일 전0
r/LocalLLaMA분석

MLX에서 온디바이스로 실행 가능한 650개 이상의 Apache-2.0 생물 의학 NER/de-id 모델: 동일한 fp32 가중치와 출력

OpenMed가 macOS 및 iOS 기기에서 실행 가능한 650개 이상의 Apache-2.0 라이선스 생물 의학 NER 및 비식별화 모델을 공개했습니다. MLX 프레임워크를 활용하여 Apple Silicon 환경에서 기존 CPU 대비 최대 40배 빠른 온디바이스 추론 성능을 제공합니다.

2일 전0
r/LocalLLaMA분석

Qwen2.5-35B-A3B 및 Gemma2-9B QAT를 위한 KV 캐시 양자화의 KLD 매핑 결과

Qwen2.5-35B-A3B 및 Gemma2-9B 모델의 KV 캐시 양자화 성능을 KLD 매핑을 통해 분석한 연구 결과입니다. 양자화 비트 수에 따른 모델별 민감도 차이와 압축 효율성을 다룹니다.

2일 전0
r/LocalLLaMA분석

7개의 중국 기업이 이미 H100/H200급 AI 칩을 출하하고 있으며, 대부분은 지난 6개월 내에 IPO를 완료했습니다. 제가 이들을 모두

중국 내 AI 가속기 시장의 급격한 성장과 주요 기업들의 동향을 분석합니다. Huawei를 포함한 빅테크와 최근 IPO를 마친 전문 기업들이 H100/H200급 칩을 출하하며 NVIDIA의 점유율을 빠르게 대체하고 있습니다.

2일 전0
r/LocalLLaMA분석

의료 기록 작성을 위한 8개 LLM 벤치마크 결과: 환각(Hallucinations)은 드물었으나, 누락(Omissions)은 주의가 필요함

의료 기록 작성을 위한 8개 LLM의 성능을 벤치마크한 결과, 환각보다 임상적 세부 사항을 누락하는 현상이 더 빈번하게 발생함을 확인했습니다. 모델 크기와 성능이 반드시 비례하지 않으며, 비용과 품질 사이의 트레이드오프가 존재함을 보여줍니다.

2일 전0
r/LocalLLaMA분석

업데이트: ik_llama.cpp를 위한 Qwen-27B-IQ4_KS 및 Qwen-27B-IQ_KS_KT, 특히 16GB VRAM을 탑재한

16GB VRAM 환경에서 Qwen-27B 모델을 효율적으로 구동하기 위한 새로운 GGUF 양자화 모델들을 소개합니다. 논리력 향상에 초점을 맞춘 IQ4_KS 방식과 실험적인 Trellis 알고리즘을 적용한 IQ4_KS_KT 모델의 성능을 비교 분석했습니다.

2일 전0
Dev.to헤드라인

AI 에이전트 확산 (AI Agent Sprawl): 왜 기업들은 2026년에 너무 많은 AI 도구에 빠져 허우적거리는가

AI 에이전트의 도입 속도가 기업의 거버넌스를 앞지르며 발생하는 'AI 에이전트 확산(AI Agent Sprawl)' 문제를 다룹니다. 도구의 파편화와 가시성 부족이 기술 부채로 이어지는 현상을 분석합니다.

2일 전0
Dev.to헤드라인

당신의 AI 에이전트가 직업, 지갑, 그리고 개인용 편지함을 갖게 될 것입니다

tiny.place는 AI 에이전트들이 신원, 발견, 결제 기능을 갖추고 자율적으로 상호작용할 수 있는 암호화된 온체인 네트워크입니다. 에이전트가 고립되지 않고 @handle을 통한 신원 확인과 Solana 기반의 결제를 수행하며 서로 거래할 수 있는 환경을 제공합니다.

2일 전0
r/LocalLLaMA분석

Tmax-27b - DPPO (RL)로 학습된 소형 GPU용 Qwen3.6-27b 터미널 에이전트

Qwen3.6-27b 기반의 터미널 에이전트 Tmax-27B를 소비자용 GPU에서 실행할 수 있도록 최적화된 GGUF 양자화 모델을 소개합니다. 중요도 행렬(imatrix) 보정을 통해 양자화 시 발생할 수 있는 에이전트의 도구 호출 및 추론 성능 저하를 최소화했습니다.

2일 전0
Dev.to헤드라인

Claude Code를 Visual Studio로 가져온 뒤 디버거를 맡겨보았다

Claude Code CLI를 Visual Studio와 연동하여 디버깅 효율을 높이는 비공식 커뮤니티 프로젝트를 소개합니다. IDE의 diff 창과 디버거 자동화를 통해 Claude가 직접 중단점을 설정하고 변수 변화를 관찰하며 버그를 찾을 수 있도록 구현했습니다.

2일 전0
Dev.to헤드라인

Hangfire에서 RabbitMQ로: .NET 앱에서 데이터베이스 폴링(Database Polling) 제거하기

Hangfire의 데이터베이스 폴링 방식이 가진 확장성 문제를 해결하기 위해 RabbitMQ로 마이그레이션한 사례를 다룹니다. 작업량과 관계없이 지속적으로 발생하는 DB 부하를 줄이고 시스템 효율을 높이는 과정을 설명합니다.

2일 전0
Dev.to헤드라인

Ponytail – 당신의 AI 에이전트가 방 안에서 가장 게으른 시니어 개발자처럼 생각하게 만드세요

Ponytail은 AI 에이전트가 최소한의 코드로 목표를 달성하도록 유도하여 코드 양을 평균 54% 줄이는 기술입니다. Claude Code 세션을 활용한 연구 결과, 안전성을 유지하면서도 비용 20%, 시간 27%를 절감하는 효과를 입증했습니다.

2일 전0
r/LocalLLaMA분석

OpenMythos 벤치마크 결과

사이버 보안 특화 소형 모델인 OpenMythos의 벤치마크 결과가 공개되었습니다. SWE-bench, CyberGym, cybench 테스트를 수행했으며, 향후 성능 향상을 위한 추가 학습을 계획 중입니다.

2일 전0
r/LocalLLaMA분석

OpenMythos 벤치마크 결과

사이버 보안에 특화된 소형 모델인 OpenMythos의 벤치마크 결과가 공개되었습니다. SWE-bench Pro, CyberGym, cybench 등 다양한 테스트를 통해 모델의 성능을 검증하였으며, 향후 추가 학습을 통해 성능을 개선할 계획입니다.

2일 전0
Yahoo Finance헤드라인

Nacha의 사기 방지 규정 시행

Nacha의 새로운 사기 모니터링 규정이 시행됨에 따라 ACH 네트워크 참여자들은 사기 거래를 선제적으로 탐지해야 합니다. 이번 규정은 사후 대응이 아닌 결제 라이프사이클 전반에 걸친 리스크 기반 프로세스 구축을 요구합니다.

2일 전0
CNBC헤드라인

예측 시장 트레이더들, Mamdani가 지지하는 후보들이 뉴욕시 예비선거에서 승리할 것으로 예상

뉴욕시 예비선거에서 Zohran Mamdani가 지지하는 후보들의 승리 가능성을 예측 시장 플랫폼 Kalshi의 트레이더들이 분석했습니다. 트레이더들은 특정 후보들의 승리 확률을 바탕으로 콤보 계약을 통해 시장의 전망을 제시하고 있습니다.

2일 전0
Dev.to헤드라인

빠른 LLM이 가르쳐준 가정(Assumptions)에 관한 교훈

빠른 LLM을 활용한 복잡한 작업 수행 시, 명시적인 '산출물(deliverables)'을 계획에 포함하는 것이 모델의 성능과 검증 가능성을 어떻게 변화시키는지 분석합니다. 산출물은 단순히 정확도를 높이는 것이 아니라, 작업의 검토 및 검증 가능성을 높이는 도구로 작용합니다.

2일 전0
Dev.to헤드라인

Claude Code가 계속 다운되어서 라우터를 직접 만들었습니다

Claude Code의 서비스 중단 및 속도 제한 문제를 해결하기 위해 Claude와 MiniMax API를 지능적으로 전환하는 AI 라우터 프록시를 구축했습니다. 작업의 복잡도에 따라 경로를 지정하거나 장애 조치를 수행하는 네 가지 라우팅 모드를 제공합니다.

2일 전0

이 피드 구독하기

본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.