본문으로 건너뛰기

Home About Portfolio Blog Insights Resume Contact

Home About Portfolio Blog Insights Resume Contact

© 2026 Molayo

Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

© 2026. Molayo. All rights reserved.

개인정보 처리방침|이용약관

Home About Portfolio Blog Insights Resume Contact

Home About Portfolio Blog Insights Resume Contact

© 2026 Molayo

Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

이 피드 구독하기

RSSFeedly, Inoreader 등으로 구독

API/api/search?q=검색어

AIllms.txt로 AI 크롤링 가이드

본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.

© 2026. Molayo. All rights reserved.

개인정보 처리방침|이용약관

r/OpenAI Codex (search) 276건필터 해제

EdgeRazor: 혼합 정밀도 양자화 인식 증류 (Mixed-Precision Quantization-Aware Distillation)를

EdgeRazor는 에지 AI를 위해 설계된 경량 프레임워크로, 혼합 정밀도 양자화 인식 증류 기술을 통해 LLM을 효율적으로 압축합니다. 최소한의 코드 수정으로 기존 훈련 파이프라인에 통합되어 성능을 유지하면서도 저비용·고효율 계산을 지원합니다.

한국은행이 AI 생산성에 관한 보고서를 막 발표했습니다

한국은행의 보고서를 인용하여 AI 도입이 실제 업무 생산성 향상으로 이어지는지에 대한 회의적인 시각을 다룹니다. AI 사용으로 업무 시간은 단축될 수 있으나, 업무량 증가와 검토 시간 소요로 인해 실질적인 생산성 증가는 미미할 것이라고 분석합니다.

AMD Strix Halo 소유자를 위한 중요한 소식

AMD Strix Halo 사용자가 NPU와 iGPU를 동시에 활용하는 하이브리드 모델 구동이 가능해졌습니다. Lemonade 소프트웨어를 통해 NPU의 빠른 프롬프트 처리 능력을 활용할 수 있으며, AMD의 소프트웨어 개선으로 하드웨어 성능을 극대화할 수 있게 되었습니다.

DeepSWE: 오늘날의 프론티어 모델들이 실제로 코드를 얼마나 잘 작성할 수 있는지 살펴보는 새로운 벤치마크

DeepSWE는 프론티어 모델의 실제 코드 작성 능력을 평가하기 위해 설계된 새로운 벤치마크입니다. 데이터 오염을 방지하고 실제 소프트웨어 엔지니어링의 복잡성을 반영하며, 신뢰할 수 있는 검증 방식을 제공합니다.

지시어 튜닝된 LLM의 은닉 상태(Hidden-State) 기하학 및 거부 행동에 미치는 비어휘적 문맥 효과

Gemma-3-12B 모델을 대상으로 비어휘적 문맥이 모델의 은닉 상태(Hidden-State)와 거부 행동에 미치는 영향을 분석한 연구입니다. 특정 텍스트를 입력하면 모델이 답변 스타일이 다른 내부 영역으로 이동하며, 이는 가중치 변화 없이도 모델의 태도를 변화시킬 수 있음을 보여줍니다.

Barry가 이제 AI 에이전트의 컨텍스트를 약 50% 절감합니다 - 동일한 사실, 더 적은 토큰

Barry는 git 저장소 기반의 메모리 시스템으로, AI 에이전트가 프로젝트의 핵심 지식을 효율적으로 로드할 수 있게 돕습니다. 토큰 사용량을 최대 50% 절감하면서도 필요한 정보의 손실 없이 컨텍스트를 관리할 수 있는 오픈 소스 도구입니다.

업데이트: Codex SQLite 로깅 문제가 0.142.0 버전에서 완전히 해결되지 않았습니다

Codex 0.142.0 버전에서 SQLite 피드백 로그의 쓰기 증폭 문제가 완전히 해결되지 않았음이 보고되었습니다. 이로 인해 과도한 SSD 쓰기 작업이 발생할 수 있으며, 차기 버전인 0.143.0에서 수정될 예정입니다.

프롬프트 사용 한도에 도달했을 때를 대비해 PromptQueue를 만들었습니다

AI 도구의 사용 한도 제한 문제를 해결하기 위해 프롬프트를 예약 실행할 수 있는 로컬 Python CLI 도구인 PromptQueue를 소개합니다. 이 도구는 ChatGPT, Claude, Cursor 등 다양한 플랫폼을 지원하며 오픈 소스로 제공됩니다.

M1 Max 컴퓨터와 로컬 ML 모델(전사(Transcription)를 위한 Whisper)을 사용하여 669GB의 GoPro 영상을

M1 Max 환경에서 OpenAI Whisper, Qwen2.5-VL 등 오픈 소스 ML 모델을 활용해 669GB 분량의 GoPro 영상을 로컬로 인덱싱하는 프로젝트를 소개합니다. 영상 내 특정 순간을 검색하고 DaVinci Resolve로 바로 보낼 수 있는 워크플로우를 구축했습니다.

왜 아무도 Microsoft의 오픈 소스 Fast Context에 대해 이야기하지 않나요!!!

Microsoft가 공개한 FastContext-1.0은 LLM 코딩 에이전트의 효율성을 높이기 위한 경량 저장소 탐색 서브 에이전트입니다. 메인 에이전트와 탐색 역할을 분리하여 병렬 도구 호출을 통해 컨텍스트를 압축하고 토큰 사용량을 획기적으로 줄입니다.

Amazon MGM, 루카 과다니노의 'Artificial' 제작 중단 — Sam Altman 전기 영화, OpenAI의 500억 달러 투자

Amazon MGM이 Sam Altman의 전기 영화 제작을 중단했습니다. 이는 Amazon과 OpenAI 간의 500억 달러 규모 거래 이후 발생한 이해 상충 문제로 분석되며, 향후 OpenAI의 IPO 전망에 영향을 미칠 수 있습니다.

대부분의 에이전트 도구는 모든 에이전트를 동일하게 만들어 생성하기 쉽게 만듭니다. 저는 각 에이전트가 독립적이기를 원했습니다. 제가 이를

독립적인 런타임과 워크스페이스를 가진 에이전트 오케스트레이션 라이브러리의 아키텍처를 소개합니다. 고정된 설정 대신 각 에이전트가 자신만의 툴체인과 환경을 가질 수 있도록 YAML 기반의 선언적 구조를 제안합니다.

OpenAI의 CSO가 재무장관, Palantir 공동 창업자와 함께하는 Peter Thiel의 16,000달러 규모 비밀 리트릿 등록 명단에

비밀 결사체 'Dialog'의 유출된 명단을 통해 OpenAI, Google DeepMind 등 빅테크 주요 인사들과 정부 관리들이 함께 참여하고 있음이 드러났습니다. 이들은 규제 기관과 산업 간의 이해 상충 문제를 야기할 수 있는 폐쇄적인 네트워크를 형성하고 있습니다.

Papers with Code의 새로운 업데이트 사항 [P]

Papers with Code가 연구 발견을 돕기 위해 대규모 업데이트를 진행했습니다. SOTA 배지 도입, GitHub 스타와 Hugging Face 지표를 결합한 새로운 트렌딩 점수, 그리고 제3자 외부 평가 지원 기능이 추가되었습니다.

DoneCheck: Codex 에이전트를 위한 완료 증명(proof-of-done) 영수증

AI 코딩 에이전트가 작업을 완료했다고 주장할 때, 실제 수행 결과에 대한 증거를 검증하는 DoneCheck를 소개합니다. 변경 파일, 검증 명령, 종료 코드 등을 통해 AI의 코드 누락이나 검증 미비 사항을 잡아내는 가벼운 게이트 역할을 합니다.

OpenAI, 삼성전자에 ChatGPT Enterprise 및 Codex 전 세계 공급

OpenAI가 삼성전자에 ChatGPT Enterprise와 Codex를 공급하는 대규모 계약을 체결했습니다. 이번 계약은 삼성전자 DX 부문의 전 세계 임직원을 대상으로 하며, OpenAI의 역대 기업용 AI 도입 사례 중 최대 규모 중 하나입니다.

Matrix Recurrent Units(MRU)에 관한 업데이트: Attention의 대안 [R]

Attention 메커니즘의 대안으로 제안된 새로운 선형 시간 시퀀스 아키텍처인 Matrix Recurrent Units(MRU)의 업데이트 내용을 다룹니다. 입력 상태 행렬 생성 방식에 따른 학습 안정성 변화와 직교 행렬 제약이 모델 성능에 미치는 영향을 분석합니다.

AI의 경제학이 오픈 모델에 유리하게 돌아가기 시작했습니다

오픈 웨이트 모델의 성능 향상과 비용 효율성 덕분에 폐쇄형 API 모델의 경제적 우위가 약화되고 있습니다. 기업들은 이제 극단적인 성능보다 비용 대비 효율성과 제어권을 중시하며 오픈 모델로 눈을 돌리고 있습니다.

diffusers 라이브러리에서 FLUX를 공부하는 것이 어려워, 더 작은 오픈 소스 버전을 만들었습니다 [P]

복잡한 diffusers 라이브러리 대신 FLUX 확산 모델의 핵심 아키텍처와 수학적 원리에 집중한 경량 PyTorch 구현체인 minFLUX를 소개합니다. FLUX.1과 FLUX.2의 차이점을 분석하며 트랜스포머 블록 및 VAE 개선 사항을 다룹니다.

LLM 대규모 추론을 위한 오픈 핸드북 (GPU 내부 구조, KV 캐시, 배치 처리, vLLM/SGLang/TensorRT-LLM)

LLM 대규모 추론의 내부 구조와 최적화 방법을 다루는 오픈 소스 핸드북을 소개합니다. GPU 실행 구조, 메모리 계층, KV 캐시, 배치 처리 등 병목 현상의 원인과 해결책을 상세히 설명합니다.

이전4 / 14다음