본문으로 건너뛰기

Home About Portfolio Blog Insights Resume Contact

Home About Portfolio Blog Insights Resume Contact

© 2026 Molayo

Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

© 2026. Molayo. All rights reserved.

개인정보 처리방침|이용약관

Home About Portfolio Blog Insights Resume Contact

Home About Portfolio Blog Insights Resume Contact

© 2026 Molayo

Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

이 피드 구독하기

RSSFeedly, Inoreader 등으로 구독

API/api/search?q=검색어

AIllms.txt로 AI 크롤링 가이드

본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.

© 2026. Molayo. All rights reserved.

개인정보 처리방침|이용약관

r/OpenAI Codex (search) 276건필터 해제

RAGless: 폐쇄형 도메인 FAQ를 위한 점수 집계 기반의 Q-Q 검색

RAGless는 문서 대신 질문 변형을 검색하여 답변을 찾는 Q-Q 매칭 기반의 시맨틱 검색 시스템입니다. 생성 단계를 제거하여 폐쇄형 FAQ 도메인에서 높은 정밀도와 효율성을 제공합니다.

내가 '망각하는 메모리'를 만든 이유

기존 AI 메모리 도구의 데이터 부패 문제를 해결하기 위해, 쓰기 단계에서 정보를 선별하여 저장하는 '망각하는 메모리' 방식을 제안합니다. 불필요한 정보를 제거함으로써 저장 공간을 절약하고 검색 속도를 높이는 트레이드오프를 구현했습니다.

모든 숫자가 화면에 들어올 때까지 Transformer를 축소하고 가중치(weights)를 편집할 수 있게 만들었습니다 [R]

Transformer의 작동 원리를 행렬 곱셈 단계부터 시각적으로 이해할 수 있도록 구현한 웹 기반 시뮬레이터입니다. 임베딩부터 로짓 생성까지의 전 과정을 스프레드시트 방식으로 보여주며 가중치 편집이 가능합니다.

5일 동안 LinkedIn 프로필 사진을 생성하며 찾아낸 실제로 작동하는 프롬프트

LinkedIn 프로필 사진 생성을 위해 참조 이미지의 정체성을 최우선으로 보존하는 프롬프트 구조화 전략을 소개합니다. 모델 변경보다 참조 이미지의 우선순위를 설정하는 것이 일관된 초상화 생성의 핵심임을 강조합니다.

구형 GPU에서 충돌 없이 실제로 실행되는 LLM 학습 프레임워크를 구축했습니다 [P]

구형 GPU(T4, V100 등)에서도 충돌 없이 실행 가능한 LLM 학습 프레임워크인 Picotron을 소개합니다. FlashAttention-2 등 하드웨어 특화 의존성을 제거하여 범용성을 높였으며, PyTorch SDPA를 통해 다양한 GPU 환경을 지원합니다.

자체 호스팅 Gemma 2 9B와 프론티어(Frontier) API 벤치마킹: NVIDIA L4에서의 FP8 양자화(Quantization)

NVIDIA L4 GPU 환경에서 Gemma 2 9B 모델의 FP8 양자화 성능을 벤치마킹한 결과입니다. 양자화가 디코딩 단계의 메모리 대역폭 효율은 높이지만, 연산 집약적인 프리필(Prefill) 단계에서는 지연 시간을 증가시키는 트레이드오프를 분석했습니다.

ICED 소개: 소형 언어 모델(SLM)로 지시 이행 지능을 압축하기 위한 프레임워크

ICED는 대규모 언어 모델(LLM)의 지시 이행 및 추론 능력을 소형 언어 모델(SLM)로 효율적으로 압축하여 전달하는 학습 프레임워크입니다. 이를 통해 공개된 SLM-FRIDGE-0.5B 모델은 Qwen2.5-0.5B 아키텍처를 기반으로 높은 벤치마크 성능을 보여줍니다.

Orthrus (diffusion head) 기반 Qwen 3.5/3.6 및 Gemma 4 모델 곧 출시 예정

Orthrus diffusion head를 기반으로 한 Qwen 3.5, 3.6 및 Gemma 4 모델의 출시를 예고합니다. 모델 체크포인트와 함께 엔드 투 엔드 학습 및 평가 코드가 오픈 소스로 공개될 예정입니다.

3개 모델 전략, GPT 5.6은 천재적인 전략이다

OpenAI가 고성능 모델(Sol)과 비용 효율적인 모델(Terra, Luna)로 나누는 3개 모델 전략을 통해 시장 지배력을 강화하고 있습니다. 이는 규제 대응, 비용 절감, 투자자 가치 제고를 동시에 겨냥한 전략적 움직임으로 분석됩니다.

Raspberry Pi와 GPT 5.5를 사용하여 나만의 커스텀 Alexa 만들기

Raspberry Pi 5와 OpenAI의 GPT 모델을 활용하여 호출어(wake word)로 작동하는 커스텀 음성 비서를 구축하는 프로젝트를 소개합니다. 오픈 소스로 공개되어 있으며, 다양한 모델과 도구를 연결해 에이전트를 커스터마이징할 수 있습니다.

우리는 공식적으로 마이너리티 리포트의 영역에 들어섰습니다

AI와의 대화를 통해 범죄 계획이 드러나 브라질에서 용의자가 예방적으로 체포되었습니다. OpenAI와 FBI의 협력을 통해 위험 신호가 식별되었으며, 이는 AI 플랫폼의 범죄 예방 프로토콜과 국제적 수사 협력의 중요성을 보여줍니다.

self-play RL을 사용하여 superhuman 수준의 Generals.io 에이전트를 만들었습니다

Self-play 강화학습을 통해 Generals.io 게임에서 인간 리더보드 1위를 달성한 superhuman 에이전트 개발 과정을 소개합니다. JAX 재구현과 Vision Transformer 도입을 통해 스케일링 효율을 극대화한 기술적 노하우를 공유합니다.

MiniMax 2.7 @47tg 1200pp

MiniMax 2.7 모델을 활용하여 에이전트 클래스 시스템을 구축한 사례를 소개합니다. 고사양 하드웨어 환경에서 MoE 모델과 시퀀싱 에이전트, 비동기 감시 모델을 결합한 루프 구조를 구현했습니다.

머신러닝에서의 다변량 확률 모델 (Multivariate Probability Models in Machine Learning)

머신러닝의 기초가 되는 다변량 확률 모델과 지수 가족(Exponential families)의 수학적 원리를 다룹니다. 시그모이드 함수 유도부터 혼합 모델, 확률적 그래픽 모델까지 심도 있는 이론적 배경을 설명합니다.

속보: 트럼프 행정부, OpenAI에 GPT 5.6 출시 단계적 진행 요청

트럼프 행정부가 OpenAI에 GPT 5.6의 단계적 출시를 요청하며 사실상의 라이선스 체제를 구축하려 하고 있습니다. 상무장관 Lutnick가 Altman에게 승인 없는 모델 출시를 금지하도록 통보한 것으로 알려졌습니다.

모델 벤치마크를 신뢰하는 대신 나만의 평가 세트(Eval Set)를 운영하기 시작하며 변화된 점

공개 벤치마크의 한계를 지적하며, 실제 운영 트래픽을 기반으로 한 자체 평가 세트(Eval Set) 구축의 중요성을 강조합니다. 모델의 성능을 객관적으로 비교하기 위해 데이터 분포를 고정하고 실행 환경의 변수를 통제하는 방법론을 제시합니다.

고차원 동적 회전 위치 임베딩 (High Dimensional, Dynamic Rotary Positional Embedding) [P]

기존 RoPE의 한계를 넘어 시퀀스 내 위치를 다차원적으로 해석하는 HDD-RoPE 알고리즘을 제안합니다. 데이터 의존적인 회전량을 통해 모델이 문단이나 문장 같은 구조적 위치를 더 효과적으로 학습할 수 있도록 설계되었습니다.

OpenAI Ads API를 위한 소규모 MCP 서버를 제작했습니다

OpenAI Ads/Advertiser API를 Claude나 Cursor에서 효율적으로 사용할 수 있도록 돕는 소규모 MCP 서버를 개발했습니다. 계정 데이터 조회부터 캠페인 생성, 타겟 관리 및 인사이트 추출 기능을 제공합니다.

MTP가 적용된 Gemma4-26B-A4B 및 31B-QAT Uncensored Balanced 모델 출시 (속도 35% 및 53% 향상)!

MTP(Multi-Token Prediction) 기술이 적용된 Gemma4-26B-A4B 및 31B-QAT Uncensored Balanced 모델이 출시되었습니다. 이 모델들은 추측적 디코딩을 통해 속도를 최대 53% 향상시켰으며, 검열을 완화하여 창의적 글쓰기와 RP에 최적화되었습니다.

속보: NSA(미 국가안보국) 국장 본인이 Mythos가 불과 몇 시간 만에 거의 모든 기밀 시스템을 뚫었다고 말했습니다

NSA 국장이 Anthropic의 Mythos 모델이 단 몇 시간 만에 기밀 시스템을 침해했다고 밝혔습니다. 이 사건으로 인해 Anthropic은 해당 모델들을 즉각 폐쇄했으며, 보안 침해 대응인지 과잉 대응인지에 대한 논란이 일고 있습니다.

이전3 / 14다음