Insights
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
X @berryxia (자동 발견) 141건필터 해제

ACL 2026 발표, GitHub 오픈소스로 7,200개 스타 획득! EverOS는 AI Agent가 모든 것을 기억하게 하며, 27B
ACL 2026에서 발표된 EverOS는 초그래프(Hypergraph) 구조의 HyperMem 기술을 통해 AI Agent에게 완전한 기억을 부여하는 메모리 운영체제입니다. 27B 모델로 397B 모델에 필적하는 성능을 구현하며, RAG 대비 압도적인 재현율을 보여줍니다.

모두가 '모든 것을 할 수 있는' AI Agent를 만드는 데 열광할 때, Matt Pocock의 /loop-me는 오히려 반대로 움직입니다.
Matt Pocock의 /loop-me는 무분별한 AI 위임 대신, 업무를 체계적으로 검토하여 자동화 가능한 반복 루프를 찾아내는 스킬입니다. 사용자는 이를 통해 명확한 워크플로 규격 파일을 생성하고 인지 부하를 줄일 수 있습니다.

OpenAI의 칩 성능만 찬양하지 마세요...
OpenAI가 추론 비용 절감을 위해 자체 개발한 첫 AI 칩 'Jalapeño'를 발표했습니다. Broadcom과 협력하여 설계된 이 칩은 전력 효율을 극대화하여 추론 비용을 약 50% 절감하는 것을 목표로 합니다.
Anthropic 전문가들의 강연 공유 (중/영 자막 포함)
Anthropic 엔지니어들이 사용하는 자기 개선형 에이전트 스웜(agent swarm)의 핵심 원리를 소개합니다. 단순히 에이전트 수를 늘리는 것이 아니라, 모델이 스스로 출력을 검증하고 피드백을 통해 반복 수정하는 '루프를 닫는(close the loop)' 메커니즘의 중요성을 강조합니다.

방금 Mistral이 OCR 4를 출시했습니다! (비오픈소스 모델)
Mistral AI가 구조화된 출력을 지원하는 Mistral OCR 4를 출시했습니다. 이 모델은 단순 텍스트 인식을 넘어 텍스트 위치(Bounding Box), 블록 분류, 신뢰도 점수를 제공하며 170개 언어를 지원합니다.

방금 텐센트(Tencent)가 EdgeOne Makers를 오픈소스로 출시했습니다! AI Agent가 한 문장으로 앱을 배포하는, 클라우드
Tencent가 AI Agent가 한 문장의 명령만으로 앱을 배포할 수 있는 오픈소스 플랫폼 'EdgeOne Makers'를 출시했습니다. GUI 중심의 기존 클라우드 방식에서 벗어나, Agent가 API와 CLI를 통해 배포 프로세스를 직접 제어하는 새로운 패러다임을 제시합니다.
AI는 '무언가를 만드는 것'을 쉽게 만들었지만, 결과물을 진정으로 훌륭하게 만드는 것은 오히려 더 어려워졌다.
Paul Bakaus가 설립한 Renaissance Geek은 AI가 초안 작성을 쉽게 만들지만, 결과물의 품질을 높이는 것은 여전히 인간의 판단력과 숙련도에 달려 있다고 강조합니다. 이들은 AI 에이전트 루프의 마지막 단계에 인간의 개입을 극대화하여 고품질 결과물을 만드는 'Augmented Craft' 철학을 지향합니다.
Apple이 그동안 하지 않았던 일을 해냈습니다.
Apple이 Apple Silicon에 최적화된 Swift 기반의 오픈 소스 Linux 컨테이너 런타임을 공개했습니다. 가상화 계층을 통한 번역 방식이 아닌 네이티브 가상화를 사용하여 성능과 격리성을 극대화한 것이 특징입니다.

자신의 편집 기술(Skills)을 Codex에 연결하여 에이전트(Agent)가 구어체 영상 소스로부터 최종 완성본까지 제작하게 만드는 방법
사용자의 편집 기술을 Codex에 연결하여 구어체 영상 소스로부터 최종 완성본까지 제작하는 에이전트 워크플로우를 소개합니다. 에이전트가 장면 분할, 애니메이션 제작, 영상 합성을 자동으로 수행하며 사용자는 피드백을 통해 프로세스를 제어합니다.
세상에, 이번에 DeepSeek의 핵심 인재를 완전히 빼앗아 왔네요!
Baidu가 공개한 Unlimited OCR은 단일 추론으로 수십 페이지의 문서를 처리하는 One-Shot Long-Horizon Parsing 기술을 선보였습니다. R-SWA 메커니즘을 통해 KV Cache 크기를 일정하게 유지하며 긴 문맥을 효율적으로 이해합니다.

A사는 또다시 엄청난 수익을 올리고 있네요!
Micron이 Anthropic과 전략적 계약을 체결하며 투자자, 고객, 파트너, 공급업체의 역할을 동시에 수행하게 되었습니다. 양사는 HBM, DRAM, SSD 협력을 통해 Claude 워크로드에 최적화된 아키텍처를 공동 설계하기로 했습니다.
세상에! 머스크의 현금 창출원(Cash Cow)이 정말 엄청나네요!
SpaceX가 AI 기업들에게 연산 능력을 제공하며 매달 약 23.2억 달러의 막대한 수익을 창출하고 있습니다. Anthropic, Google 등 주요 AI 기업과의 계약을 통해 SpaceX는 단순 우주 항공 기업을 넘어 AI 인프라 기업으로 진화하고 있습니다.
이거 일본에서 만든 건가요? Fugu?
Sakana가 단일 API 호출로 멀티 에이전트 오케스트레이션을 수행하는 'Fugu'를 발표했습니다. 이 시스템은 작업을 분해하고 최적의 모델을 동적으로 선택하여 결과를 합성하며, 특정 모델 공급업체의 리스크를 회피할 수 있는 구조를 갖췄습니다.
엄청난 속도에 정말 놀랐습니다!
Baidu가 공개한 오픈 소스 모델 Unlimited-OCR은 R-SWA 기술을 통해 긴 문서도 매우 빠르고 안정적으로 처리합니다. 기존의 페이지별 순차 처리 방식에서 벗어나 엔드투엔드 방식으로 문서 전체의 구조와 맥락을 한 번에 파악합니다.

DeepSeek-V4-Flash 6월 28일까지 무료 제공
DeepSeek-V4-Flash 모델이 6월 28일까지 무료로 제공됩니다. 284B MoE 구조와 1M 컨텍스트 길이를 지원하며, 뛰어난 코딩 및 에이전트 능력을 갖추고 있습니다.
Codex의 마지막 능력까지 쥐어짜내기!
Codex를 위한 무한 캔버스 플러그인인 'Cowart'가 오픈 소스로 공개되었습니다. 사용자는 캔버스 위에서 자연어를 사용하여 이미지를 직관적으로 주석 달고 수정할 수 있습니다.

직접 테스트 완료! 정말 유용합니다!
위챗 공식 계정의 URL을 입력하면 이미지와 함께 Markdown으로 자동 변환해 주는 실용적인 도구를 소개합니다. Camoufox 브라우저를 활용해 안티 크롤링을 효과적으로 우회하며, 변환된 내용을 PPT로 확장 활용할 수 있습니다.
중대 발표, AlphaFold의 아버지 John Jumper가 Google DeepMind를 떠나 Anthropic에 합류하다🤯
AlphaFold를 개발하여 노벨 화학상을 수상한 John Jumper가 Google DeepMind를 떠나 Anthropic에 합류했습니다. 이는 OpenAI 출신 인재들에 이어 최정상급 연구자들이 Anthropic으로 모이는 현상을 보여주며, AI 산업 내 인재 확보 경쟁을 시사합니다.

Matthew Berman이 구축한 Loop Library: 에이전트 루프(Agent Loop) 템플릿 공유 및 커뮤니티 라이브러리
Matthew Berman이 에이전트 루프(Agent Loop) 템플릿을 모아둔 'Loop Library'를 공개했습니다. 사용자는 검증된 다단계 워크플로우를 검색하여 즉시 사용하거나 자신의 루프를 기여할 수 있습니다.

Codex를 사용하여 38시간 연속 작업 및 301개 브랜치 제출, '스킬을 생성하는 스킬'을 2.0 버전으로 업그레이드
Codex를 활용해 38시간 동안 301개의 브랜치를 제출하며 '메타 스킬(yao-meta-skill)'을 2.0 버전으로 업그레이드한 사례를 소개합니다. 에이전트가 스스로 도구를 개선하고 리팩토링하는 고도의 자율성을 보여주는 사례입니다.
이 피드 구독하기
본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.