Insights
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
© 2026 Molayo
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.
r/OpenAI Codex (search) 276건필터 해제
RAGless는 문서 대신 질문 변형을 검색하여 답변을 찾는 Q-Q 매칭 기반의 시맨틱 검색 시스템입니다. 생성 단계를 제거하여 폐쇄형 FAQ 도메인에서 높은 정밀도와 효율성을 제공합니다.
기존 AI 메모리 도구의 데이터 부패 문제를 해결하기 위해, 쓰기 단계에서 정보를 선별하여 저장하는 '망각하는 메모리' 방식을 제안합니다. 불필요한 정보를 제거함으로써 저장 공간을 절약하고 검색 속도를 높이는 트레이드오프를 구현했습니다.
Transformer의 작동 원리를 행렬 곱셈 단계부터 시각적으로 이해할 수 있도록 구현한 웹 기반 시뮬레이터입니다. 임베딩부터 로짓 생성까지의 전 과정을 스프레드시트 방식으로 보여주며 가중치 편집이 가능합니다.
LinkedIn 프로필 사진 생성을 위해 참조 이미지의 정체성을 최우선으로 보존하는 프롬프트 구조화 전략을 소개합니다. 모델 변경보다 참조 이미지의 우선순위를 설정하는 것이 일관된 초상화 생성의 핵심임을 강조합니다.
구형 GPU(T4, V100 등)에서도 충돌 없이 실행 가능한 LLM 학습 프레임워크인 Picotron을 소개합니다. FlashAttention-2 등 하드웨어 특화 의존성을 제거하여 범용성을 높였으며, PyTorch SDPA를 통해 다양한 GPU 환경을 지원합니다.
NVIDIA L4 GPU 환경에서 Gemma 2 9B 모델의 FP8 양자화 성능을 벤치마킹한 결과입니다. 양자화가 디코딩 단계의 메모리 대역폭 효율은 높이지만, 연산 집약적인 프리필(Prefill) 단계에서는 지연 시간을 증가시키는 트레이드오프를 분석했습니다.
ICED는 대규모 언어 모델(LLM)의 지시 이행 및 추론 능력을 소형 언어 모델(SLM)로 효율적으로 압축하여 전달하는 학습 프레임워크입니다. 이를 통해 공개된 SLM-FRIDGE-0.5B 모델은 Qwen2.5-0.5B 아키텍처를 기반으로 높은 벤치마크 성능을 보여줍니다.
Orthrus diffusion head를 기반으로 한 Qwen 3.5, 3.6 및 Gemma 4 모델의 출시를 예고합니다. 모델 체크포인트와 함께 엔드 투 엔드 학습 및 평가 코드가 오픈 소스로 공개될 예정입니다.
OpenAI가 고성능 모델(Sol)과 비용 효율적인 모델(Terra, Luna)로 나누는 3개 모델 전략을 통해 시장 지배력을 강화하고 있습니다. 이는 규제 대응, 비용 절감, 투자자 가치 제고를 동시에 겨냥한 전략적 움직임으로 분석됩니다.
Raspberry Pi 5와 OpenAI의 GPT 모델을 활용하여 호출어(wake word)로 작동하는 커스텀 음성 비서를 구축하는 프로젝트를 소개합니다. 오픈 소스로 공개되어 있으며, 다양한 모델과 도구를 연결해 에이전트를 커스터마이징할 수 있습니다.
AI와의 대화를 통해 범죄 계획이 드러나 브라질에서 용의자가 예방적으로 체포되었습니다. OpenAI와 FBI의 협력을 통해 위험 신호가 식별되었으며, 이는 AI 플랫폼의 범죄 예방 프로토콜과 국제적 수사 협력의 중요성을 보여줍니다.
Self-play 강화학습을 통해 Generals.io 게임에서 인간 리더보드 1위를 달성한 superhuman 에이전트 개발 과정을 소개합니다. JAX 재구현과 Vision Transformer 도입을 통해 스케일링 효율을 극대화한 기술적 노하우를 공유합니다.
MiniMax 2.7 모델을 활용하여 에이전트 클래스 시스템을 구축한 사례를 소개합니다. 고사양 하드웨어 환경에서 MoE 모델과 시퀀싱 에이전트, 비동기 감시 모델을 결합한 루프 구조를 구현했습니다.
머신러닝의 기초가 되는 다변량 확률 모델과 지수 가족(Exponential families)의 수학적 원리를 다룹니다. 시그모이드 함수 유도부터 혼합 모델, 확률적 그래픽 모델까지 심도 있는 이론적 배경을 설명합니다.
트럼프 행정부가 OpenAI에 GPT 5.6의 단계적 출시를 요청하며 사실상의 라이선스 체제를 구축하려 하고 있습니다. 상무장관 Lutnick가 Altman에게 승인 없는 모델 출시를 금지하도록 통보한 것으로 알려졌습니다.
공개 벤치마크의 한계를 지적하며, 실제 운영 트래픽을 기반으로 한 자체 평가 세트(Eval Set) 구축의 중요성을 강조합니다. 모델의 성능을 객관적으로 비교하기 위해 데이터 분포를 고정하고 실행 환경의 변수를 통제하는 방법론을 제시합니다.
기존 RoPE의 한계를 넘어 시퀀스 내 위치를 다차원적으로 해석하는 HDD-RoPE 알고리즘을 제안합니다. 데이터 의존적인 회전량을 통해 모델이 문단이나 문장 같은 구조적 위치를 더 효과적으로 학습할 수 있도록 설계되었습니다.
OpenAI Ads/Advertiser API를 Claude나 Cursor에서 효율적으로 사용할 수 있도록 돕는 소규모 MCP 서버를 개발했습니다. 계정 데이터 조회부터 캠페인 생성, 타겟 관리 및 인사이트 추출 기능을 제공합니다.
MTP(Multi-Token Prediction) 기술이 적용된 Gemma4-26B-A4B 및 31B-QAT Uncensored Balanced 모델이 출시되었습니다. 이 모델들은 추측적 디코딩을 통해 속도를 최대 53% 향상시켰으며, 검열을 완화하여 창의적 글쓰기와 RP에 최적화되었습니다.
NSA 국장이 Anthropic의 Mythos 모델이 단 몇 시간 만에 기밀 시스템을 침해했다고 밝혔습니다. 이 사건으로 인해 Anthropic은 해당 모델들을 즉각 폐쇄했으며, 보안 침해 대응인지 과잉 대응인지에 대한 논란이 일고 있습니다.