본문으로 건너뛰기

Home About Portfolio Blog Insights Resume Contact

Home About Portfolio Blog Insights Resume Contact

© 2026 Molayo

Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

© 2026. Molayo. All rights reserved.

개인정보 처리방침|이용약관

Home About Portfolio Blog Insights Resume Contact

Home About Portfolio Blog Insights Resume Contact

© 2026 Molayo

Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

이 피드 구독하기

RSSFeedly, Inoreader 등으로 구독

API/api/search?q=검색어

AIllms.txt로 AI 크롤링 가이드

본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.

© 2026. Molayo. All rights reserved.

개인정보 처리방침|이용약관

r/OpenAI Codex (search) 276건필터 해제

LocalLLaMA 게시물 티어 리스트

LocalLLaMA 커뮤니티 내 게시물 품질에 대한 주관적인 티어 리스트를 정리한 글입니다. 유용한 모델 출시, 최적화 정보, 하드웨어 성능 데이터 등 가치 있는 정보와 무의미한 밈, 광고성 게시물을 구분하여 제시합니다.

llama.cpp의 파이프라인 병렬화 (Pipeline parallelism)가 VRAM을 낭비하고 있을 수 있습니다

llama.cpp의 파이프라인 병렬화가 단일 요청 시 불필요한 VRAM을 소모할 수 있음을 분석합니다. 컴파일 옵션 조정을 통해 연산 버퍼 할당을 줄여 VRAM 효율을 높이는 방법을 제안합니다.

OpenAI와 Anthropic이 데이터 에이전트(Data Agents)를 구축하는 서로 다른 방식

OpenAI와 Anthropic의 데이터 에이전트 구축 방식 차이를 분석하며, 에이전트의 성능이 데이터 인프라의 품질에 달려 있음을 설명합니다. 단순 파일 접근을 넘어 메타데이터와 시맨틱 레이어의 중요성을 강조합니다.

JetBrains Mellum 2: 정말 훌륭하고 성능이 뛰어난 모델

JetBrains에서 출시한 Mellum 2 12B MoE 모델의 성능과 속도를 리뷰합니다. 12B 파라미터 중 2.5B만 활성화되는 MoE 구조를 통해 매우 빠른 추론 속도와 뛰어난 도구 호출(Tool Calling) 능력을 보여줍니다.

[후속 질문] Qwen3.6-35B-A3B 8GB RTX: Linux를 시도하고 Gemma 4를 테스트해 본 결과, 왜 Windows가 더

로컬 LLM 구동 시 Windows와 Linux 환경의 성능 차이를 분석한 실험 결과입니다. NVIDIA 드라이버의 '시스템 메모리 폴백' 기능 유무가 VRAM 부족 상황에서 성능 급락을 방지하는 핵심 요인임을 밝혀냈습니다.

Blackwell 16GB LLM 스타터 키트 - RTX 5070 Ti / 5080 (NVIDIA 16GB GPU)를 위한 벤치마크 및 설정

RTX 5070 Ti 및 5080(16GB VRAM) 환경에서 멀티모달 추론을 실행하기 위한 설정과 벤치마크 정보를 공유합니다. 사용자가 자신의 GPU 사양으로 모델 실행 가능 여부를 판단하는 데 도움을 주기 위한 가이드입니다.

소규모 로컬 LLM을 위한 매우 가벼운 오픈 웹 검색 도구 - 이제 SearXNG 지원

소규모 로컬 LLM을 위한 경량 오픈 소스 웹 검색 도구인 TinySearch v0.2.0이 출시되었습니다. 이번 업데이트를 통해 SearXNG를 기본 검색 백엔드로 지원하여 검색 엔진 의존성을 낮추고 안정성을 높였습니다.

OpenAI의 널리 인용되는 140억 달러 규모의 2026년 손실 목표치에는 약 100억 달러의 주식 기반 보상이 제외되어 있습니다

OpenAI의 2026년 예상 손실액이 주식 기반 보상(SBC)을 포함할 경우 기존 발표보다 훨씬 높은 250억~260억 달러에 달할 것이라는 분석입니다. 이는 기업의 자금 소진 기간(runway)을 단축시키며, 수익성 전환 시점과 IPO 시점에 중대한 재무적 변수가 될 전망입니다.

llama.cpp용 버전 관리자를 만들게 된 계기

llama.cpp의 빠른 업데이트 주기에 대응하기 위해 개발된 Go 기반의 경량 버전 관리 도구 'lvm'을 소개합니다. 사용자는 nvm과 유사한 방식으로 다양한 빌드를 간편하게 설치, 전환 및 관리할 수 있습니다.

LLM 에이전트를 위한 로컬 우선 레드팀 (Red-team) 실행

LLM 에이전트의 보안 테스트를 위한 오픈 소스 CLI 도구인 RedThread를 소개합니다. 에이전트가 실제 환경에 접근하기 전, 로컬 스테이징 환경에서 공격 시나리오를 재현하고 비교할 수 있도록 설계되었습니다.

Apodex-1.0 Smol 모델(0.8B, 2B, 4B Open-Weights) 출시: 에이전트 검증(Agentic Verification)

Apodex-1.0 Smol 모델 시리즈(0.8B, 2B, 4B)가 출시되었습니다. 이 모델들은 장기적 과업 수행 시 에이전트 루프 내에서 사실 확인 및 도구 호출 검증과 같은 특정 하위 작업을 전문적으로 처리하도록 설계된 오픈 가중치 모델입니다.

GPT 5.5 vs Fable/Mythos 5 다마고치 대결

Openclaw Agent를 활용하여 GPT 5.5, Claude Fable/Mythos 5 등 6개 주요 AI 모델의 코딩 및 게임 제작 능력을 비교 테스트했습니다. 동일한 프롬프트를 사용하여 플레이 가능한 다마고치 게임을 구현하는 성능과 비용을 분석했습니다.

Papers Without Code 소개 [P]

Hugging Face 팀이 최첨단 기술(SOTA)을 확인할 수 있는 paperswithcode.co를 재출시했습니다. arXiv와 Hugging Face의 논문을 자동 파싱하여 리더보드를 생성하며, 폐쇄형 모델의 평가 결과 포함 여부를 설정할 수 있는 기능이 추가되었습니다.

모든 에이전트는 보안이 형편없습니다. 제 것은 그렇지 않습니다. OpenLumara에 대한 제 게시물을 보셨을지도 모르겠네요... 여러분

AI 에이전트 OpenLumara의 보안 취약점을 테스트하는 챌린지와 그 결과에 대해 다룹니다. 경로 탐색, 임의 코드 실행, 샌드박스 탈출 등 발견된 주요 보안 결함과 이에 대한 수정 사항을 공유합니다.

NPT (핵확산방지조약) 비유를 통한 Anthropic의 차별적 AI 배포 전략 분석

Anthropic이 특정 파트너에게만 고성능 모델을 제공하고 경쟁자에게는 성능을 제한하는 차별적 배포 전략을 취하는 가운데, DeepSeek과 Qwen 등 중국 모델의 오픈 소스 공세가 거세지고 있습니다. 기술 독점과 개방형 생태계 사이의 격차가 심화되며 AI 시장의 패권 구도가 변화하고 있습니다.

작업 검증 가능성(Task Verifiability)에 따른 LLM 라우팅: Karpathy의 프레임워크에서 영감을 받은 소규모 실험

Karpathy의 프레임워크를 바탕으로 작업의 검증 가능성에 따른 LLM 성능 격차를 실험했습니다. 코드 테스트나 JSON 추출처럼 검증 가능한 작업은 소규모 모델도 프런티어 모델에 근접하는 성능을 보였습니다.

Ollama + LM Studio에 완전 오프라인 음성 루프를 연결했습니다 — 100% CPU, GPU 없음, 데이터 유출 없음 (Silero

Ollama와 LM Studio를 활용하여 GPU 없이 CPU만으로 구동되는 100% 오프라인 음성 루프 시스템을 구축하는 방법을 소개합니다. Silero VAD, Parakeet TDT, Supertonic TTS를 ONNX 기반으로 연결하여 데이터 유출 없는 완전한 로컬 음성 AI 환경을 구현했습니다.

Anthropic은 아무것도 되돌리지 않고 있다

Anthropic이 Claude의 성능을 사용자별로 차별적으로 제한하거나 지능을 억제하고 있다는 비판을 다룹니다. AI가 핵심 지적 인프라가 된 상황에서 사기업이 지능에 대한 접근권을 독점적으로 통제하는 것에 대한 위험성을 경고합니다.

하나의 프롬프트, 실제 자금이 걸린 질문, 다섯 가지 모델: 실시간 사기 탐지에서의 Fable 5 vs GPT-5.5 vs Claude 4.x

실제 자금이 걸린 크라우드펀딩 플랫폼에서 5가지 최신 AI 모델의 사기 탐지 및 감사 능력을 비교 실험했습니다. Fable 5만이 외부 데이터를 통해 주장을 검증하는 데 성공했으며, 모델 간의 적대적 불확실성 대응 능력 차이를 확인했습니다.

모바일 앱에 실제 AI 에이전트를 출시하며 느낀 점: AI 에이전트 개발사를 선택하는 것은 모델을 선택하는 것보다 더 중요합니다

모바일 앱에 AI 에이전트를 직접 출시하며 얻은 실무 경험을 공유합니다. 단순 채팅 API 통합을 넘어 도구 사용, 상태 관리, 오류 복구 및 권한 모델 설계가 에이전트 개발의 핵심임을 강조합니다.

이전11 / 14다음