Insights
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
X @berryxia (자동 발견) 141건필터 해제
강력하게 공감하는 관점: Agent는 능력 격차를 메우기보다 증폭시킨다
AI Agent는 능력의 격차를 해소하기보다 오히려 증폭시키는 경향이 있습니다. 이미 시스템 구축 능력을 갖춘 최상위 사용자들은 Agent를 통해 역량을 수만 배로 증폭시킬 것이며, 목표가 불분명한 일반 사용자의 혼란 역시 더욱 커질 수 있다는 분석입니다.
애플의 보안성 문제와 새로운 Siri AI 우회 사용법
해외 기술 전문가들이 애플의 새로운 Siri AI 기능을 공식 대기 목록 없이 강제로 활성화하는 방법을 발견했습니다. 시스템 파일인 GenerativeModels.plist를 수정하고 SIP(System Integrity Protection)를 비활성화한 후, 특정 토글을 조작하여 숨겨진 EnhancedSiriWaitlist를 열어젖힐 수 있습니다.
여러분, Google의 이번 발표는 존재감이 전혀 없네요...
Google이 70개 이상의 언어와 2,000개의 언어 쌍을 지원하는 Gemini 3.5 Live Translate를 공개 프리뷰로 출시했습니다. 저지연 음성 대 음성 번역을 통해 개발자들이 앱에 실시간 글로벌 소통 기능을 즉시 통합할 수 있게 되었습니다.
Mythos 대신 등장한 Anthropic의 Claude Fable 5
Anthropic이 새로운 모델 Claude Fable 5를 공개했습니다. 이 모델은 벤치마크에서 SOTA를 기록하며 소프트웨어 엔지니어링 및 과학 연구 등 고난도 작업에서 압도적인 성능을 보여줍니다. 특히 강력한 성능과 정밀한 세이프가드를 동시에 구현한 것이 특징입니다.
진정한 시스템 설계에는 다양한 엔지니어링이 필요합니다
견고한 시스템 설계는 프롬프트 엔지니어링, 컨텍스트 엔지니어링, 메모리 모듈 등 다양한 공학적 요소들의 조합을 필요로 합니다. 이 모든 연결 고리가 필수적으로 상호 의존하며 하나의 통합된 시스템을 구성합니다.

밤샘하지 않은 형제들은 보세요, WWDC 2026 요약!
WWDC 2026을 통해 Apple의 차세대 AI 아키텍처와 Tim Cook의 CEO 퇴임 소식을 요약합니다. 온디바이스 3B 모델과 20B MoE 모델을 활용한 이중 트랙 전략 및 Siri의 진화, Xcode의 다중 모델 지원 등 하드웨어와 소프트웨어가 결합된 AI 생태계 변화를 다룹니다.
Panda와 동료들의 인정에 감사하며, Mac에서 실행되는 6.6B 소형 모델에 대하여
Mac에서 로컬로 실행 가능한 6.6B 파라미터 규모의 소형 언어 모델인 Mac-1에 대해 소개합니다. 이 모델은 단 7GB의 메모리만으로 구동되어 Siri와 같은 기존 클라우드 기반 서비스의 대안이 될 수 있습니다.
세상에, 이건 애플의 영역을 직접 침범하는 거 아닌가요!
6.6B 규모의 소형 모델인 Mac-1이 Mac 로컬 환경에서 487개의 네이티브 도구를 연결해 에이전트 기능을 수행합니다. 클라우드 의존성을 낮추고 65 tok/s의 빠른 속도로 이메일 발송 및 회의 예약 등 복잡한 작업을 자동 수행합니다.

대형 모델들은 더 이상 추론에 집착하지 않습니다. 이제는 모두 계획 능력 (Planning abilities)에 집착하기 시작했습니다!
Tencent Hunyuan이 LLM의 실제 계획 능력을 테스트하고 훈련하기 위한 오픈 소스 프레임워크인 PlanningBench를 공개했습니다. 이 프레임워크는 6개 카테고리의 30개 이상의 실제 작업을 통해 모델의 계획 능력을 정밀하게 측정하고 미세 조정할 수 있도록 지원합니다.
Firecrawl의 기념비적인 데이터 수치를 보고 정말 놀랐습니다.
Firecrawl은 2년 만에 80억 개의 웹 페이지를 크롤링하며 AI 에이전트를 위한 핵심 인프라로 성장했습니다. 단순 크롤러를 넘어 AI가 즉시 소비 가능한 구조화된 웹 컨텍스트 레이어를 제공합니다.
Xcode의 가치가 더욱 약화되어 결국 버려지게 되겠군요!
OpenAI Developers가 출시한 Build iOS Apps 플러그인을 통해 Codex 내에서 iOS 앱을 실시간 실행하고 SwiftUI 미리보기를 확인할 수 있게 되었습니다. 이로 인해 개발자는 Xcode를 거치지 않고도 코드 작성부터 실행, 수정까지 하나의 인터페이스에서 완료할 수 있습니다.
온디바이스 모델의 능력이 계속해서 확장되고 있습니다!
Gemma 4 12B와 Google AI Edge의 통합을 통해 노트북에서 100% 온디바이스 에이전틱 워크플로우를 실행할 수 있게 되었습니다. LiteRT-LM을 활용하여 네트워크 연결 없이 로컬에서 모델을 서빙하며, 개인정보 보호와 저지연성을 동시에 확보합니다.

“세계는 단어로 구성되지 않는다”: Fei-Fei Li가 논하는 세계 모델(World Models)의 세 가지 형태와 공간 지능(Spatial
Fei-Fei Li는 AI의 다음 프런티어로 공간 지능을 제시하며, 세계 모델을 렌더러, 시뮬레이터, 플래너의 세 가지 핵심 기능으로 분류합니다. 특히 물리적 정확성을 담보하는 시뮬레이터가 렌더링과 계획을 잇는 구조적 중추임을 강조합니다.
OpenAI의 GPT-Rosalind 업그레이드: 범용 모델의 한계를 넘어 생명과학 전문 모델로
OpenAI가 생명과학 연구에 특화된 기업용 모델인 GPT-Rosalind를 업그레이드했습니다. 이 모델은 GPT-5.5의 에이전트 코딩 및 도구 호출 능력을 기반으로 신약 개발과 분자 분석 등 전문적인 연구 워크플로우를 직접 수행합니다.

음성, 음악, 환경음을 하나의 모델로 통합하여 폐쇄형 솔루션을 압도하는 오픈소스 모델의 등장
MOSS-Audio는 음성, 음악, 환경음을 하나의 모델로 통합한 오픈소스 오디오-언어 모델입니다. 기존의 분절된 폐쇄형 솔루션과 달리 아키텍처 차원에서 세 요소를 통합하여 뛰어난 성능을 보여줍니다.

오래된 나무에 새 꽃이 피었습니다, Microsoft가 오늘 새로운 모델을 발표했습니다😄
Microsoft AI가 처음부터 새롭게 학습된 7개의 MAI 모델 제품군을 발표했습니다. 추론, 코딩, 이미지, 전사, 음성 등 각 작업에 특화된 모델들로 구성되었으며, 데이터 혈통의 순수성과 모델 간 협업을 강조합니다.
여러분, Google DeepMind 팀이 또 사고를 쳤습니다!
Google DeepMind가 Gemini 기반의 다중 에이전트 시스템인 'Co-Scientist'를 발표했습니다. 이 시스템은 가설 생성부터 검증까지 과학적 연구 사이클 전체를 수행하며 연구자의 혁신적인 파트너 역할을 합니다.
여러분, Codex가 정말 미쳤습니다!
OpenAI가 Python 코드 내에서 직접 Codex를 제어할 수 있는 SDK를 출시했습니다. 스레드 관리, 상태 유지, 샌드박스 제어 기능을 통해 Codex를 단순한 IDE를 넘어 프로그래밍 가능한 인프라로 확장했습니다.

ByteDance의 Gu Quanquan 약력 요약
ByteDance Seed의 Gu Quanquan 교수가 퇴사를 발표하며 지난 3년간의 연구 성과를 요약했습니다. 그는 AI 기반 신약 개발 모델인 SeedFold와 SeedProteo를 구축하고, LLM의 사전 훈련 및 스케일링 기술을 혁신하는 데 기여했습니다.
지난 4월 내부 Apple에서 ComfyUI 워크플로우를 소개했을 때 많은 분이 당황해하셨던 것을 기억합니다!
ComfyUI가 이미지, 3D, 오디오, 비디오를 아우르는 11개의 최신 모델을 통합하며 워크플로우 생산성을 극대화하고 있습니다. Krea 2, VOID, Tripo 3.1 등 다양한 모델을 노드 방식으로 드래그 앤 드롭하여 복잡한 멀티모달 작업을 손쉽게 수행할 수 있습니다.
이 피드 구독하기
본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.