Insights
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
X @so_ainsight (자동 발견) 138건필터 해제
GitHub 1만 스타 돌파, AI 코딩 에이전트의 장기 기억을 위한 Agentmemory 공개
AI 코딩 에이전트의 장기 기억을 지원하는 오픈소스 프로젝트인 Agentmemory가 GitHub에서 1만 스타를 돌파했습니다. 이 도구는 정적인 규칙 파일 대신 작업 이력과 설계 방침을 검색 가능한 메모리 서버 형태로 관리하여, AI가 프로젝트의 맥락을 효율적으로 호출할 수 있게 합니다.
Google I/O 직전 Gemini의 최저가·최속 Live 모델 출시 가능성
Google I/O를 앞두고 Google Cloud Console에서 'Gemini 3.2 Flash-Lite-Live'라는 명칭의 새로운 모델이 포착되었습니다. 이 모델은 초저지연 스트리밍과 실시간 음성 및 영상 상호작용을 지원하며, 상시 작동하는 AI 에이전트 구현에 최적화된 최저가·최속 모델이 될 것으로 기대됩니다.
Google Cloud Console에서 유출된 Gemini 3.2 Flash-Lite-Live 모델 정보
Google Cloud Console의 백엔드 추적 과정에서 새로운 모델인 Gemini 3.2 Flash-Lite-Live의 정보가 유출되었습니다. 이 모델은 초저지연 스트리밍과 실시간 음성 및 영상 상호작용에 특화되어 설계되었습니다.
AI 로봇이 블루칼라 (Blue-collar) 업무를 빼앗기 시작했다.
AI 로봇이 블루칼라 업무 영역으로 진출하며 인간의 노동 시장에 변화를 예고하고 있습니다. Figure 공식은 휴식이나 수면 없이 24시간 가동 가능한 휴머노이드 로봇을 실험하며, 이 로봇들은 밤낮없이 동일한 작업을 지속적으로 수행할 수 있는 능력을 보여주고 있습니다.
진짜 편리함. Claude Code로 iOS 앱의 동작 확인 및 QA를 AI에게 맡길 수 있는 시대에.
Claude Code를 활용하면 iOS 앱의 동작 확인 및 QA(Quality Assurance) 과정을 AI에 위임할 수 있게 되었습니다. 사용자는 단순히 '이 앱을 테스트해줘'라고 요청하는 것만으로, 화면 열기, 버튼 누르기 등의 상호작용은 물론 크래시나 표시 깨짐 같은 오류를 찾아내고 로그가 포함된 리포트로 정리하는 작업을 AI에게 맡길 수 있습니다.
진짜 미쳤어. Anthropic이 아직 출시하지 않은 AI "Claude Mythos"가 해커 능력을 측정하는 벤치마크에서 다른 모델들을…
Anthropic이 아직 출시하지 않은 AI 모델 'Claude Mythos'가 해커 능력을 측정하는 벤치마크인 ExploitBench에서 다른 상용 모델들을 압도적으로 앞서고 있다는 내용입니다. 이 벤치마크는 V8 엔진의 알려진 버그를 이용해 코드를 실행하거나 내부 메모리를 조작하고, 최종적으로 시스템 권한을 탈취할 수 있는 능력을 측정합니다. 기존 공개 모델들(GPT-5.5, Claude Opus 4.7 등)은 단순히 '버그 재현' 수준에 머물렀으나, Mythos는 27년간 알려지지 않은 OpenBSD 취약점 발견, FFmpeg 버그 특정, 그리고 여러 리눅스 커널 취약점을 연결하여 완전한 관리자 권한을 탈취하는 등의 능력을 보여주었습니다.
진짜 편리함. Agentmemory 가 GitHub에서 1만 스타 돌파. 「AI 코딩 에이전트의 기억 서버」가 공개되었습니다. 이름은...
Agentmemory라는 'AI 코딩 에이전트의 기억 서버'가 공개되어 GitHub에서 1만 스타를 돌파했습니다. 이 도구는 개발자가 작업 내용을 자동으로 기록하고, 필요한 문맥(Context)만을 검색하여 AI에 프로젝트의 기억을 추가할 수 있게 합니다.
예를 들어, "지난번 인증 구현 방침을 바탕으로, Rate Limit (속도 제한)을 추가해줘"라고 요청하면,
이 기술은 사용자가 '지난번 인증 구현 방침을 바탕으로, Rate Limit(속도 제한)을 추가해줘'와 같은 요청을 했을 때, 과거의 작업 이력 검색, 관련 설계 판단 추출, 그리고 현재 구현에 필요한 문맥 전달 기능을 조합하여 실행할 수 있게 합니다. 이를 통해 개발 과정에서 일관성을 유지하며 새로운 기능을 효율적으로 구현하는 것이 가능합니다.
이것이 무엇이 대단하냐면, CLAUDE(.md)나 .cursorrules에 전부를 써 내려가는 것이 아니라 「검색 가능한 장기 기억
AI 개발 도구에 '검색 가능한 장기 기억(Long-term memory)' 기능을 추가할 수 있다는 것이 핵심입니다. Agentmemory는 사용자의 작업 이력을 기록하고, 필요한 문맥만을 다음 세션에서 효율적으로 불러와 AI 모델의 성능을 향상시킵니다.
진짜 신. 「CapCut가 조금씩 유료화해 온 비디오 편집을, 완전 무료·워터마크 없이 되찾은 오픈소스 버전」이 해외에서 화제입니다.…
CapCut이 유료화하는 추세에 반발하여, 비디오 편집 기능을 완전 무료로 제공하고 워터마크가 없는 오픈소스 버전인 OpenCut이 해외에서 큰 주목을 받고 있습니다. 이 프로젝트는 GitHub 공개 이후 1년도 안 되어 50,000 스타를 돌파하며 높은 인기를 입증했습니다. 주요 기능으로는 타임라인 편집과 멀티트랙 대응이 가능하며, 사용자의 기기 내에서 비디오 처리가 이루어지므로 개인 정보 보호 측면에서도 강점을 가집니다.
3D 산업이 진짜로 바뀐다. 이미지 1장만으로 "걸을 수 있는 3D 월드"를 약 5분 만에 생성하는 리포지토리가 GitHub에 공개됐다.…
단일 이미지 입력만으로 '걸어 다닐 수 있는' 완성도 높은 3D 월드를 약 5분 만에 생성하는 리포지토리가 공개되었습니다. 이 시스템은 배경 공간(Gaussian Splat), 동적 오브젝트(.glb/.obj), 환경음 및 효과음(.mp3)을 각각의 전문 AI가 분담하여 동시에 출력합니다. 이는 기존의 '3D 모델링' 방식에서 벗어나, 이미지를 기반으로 3차원 세계를 즉시 '생성'하는 패러다임 전환을 의미하며, Unity나 Three.js 같은 엔진에 바로 통합할 수 있는 완성품을 제공합니다.
진짜 대단합니다. AI 에이전트 5체가 팀을 이루어 YouTube 운영을 통째로 돌려줍니다. 「YouTube 버전의 “전자동 편집부”」가
5개의 AI 에이전트 팀이 협력하여 YouTube 채널 운영 전반을 자동화하는 시스템, 'youtube-automation-agent'가 공개되었습니다. 이 시스템은 대본 작성부터 최종 업로드까지 노코드 방식으로 처리할 수 있습니다. 특히 Gemini의 무료 범위를 활용하면 AI 사용 비용 없이도 운영이 가능합니다.
이것은 대단합니다
디자인 검토 과정의 어려움을 해결하기 위해 '전자동 디자인 리뷰 툴'이 개발되었습니다. 이 툴은 Claude Code의 기능을 활용하여 자동화되었으며, 이미지나 Figma, 사이트 URL을 입력받아 도메인 지식을 고려한 디자인 리뷰를 수행합니다. 또한, GPT Image 2를 이용해 개선된 디자인 시안까지 생성하는 것이 특징입니다.
이거 너무 편리해. 해외에서 화제가 된 방법으로, Claude에게 "이 앱 전체를 하나의 HTML과 하나의 JSON으로 정리해줘"라고…
Claude에게 '이 앱 전체를 하나의 HTML과 하나의 JSON으로 정리해줘'라고 요청하는 방법은 복잡한 시스템을 이해하기 쉽게 시각화할 수 있는 편리한 기술입니다. 이 방법을 사용하면 현재의 설계 구조가 눈에 보이게 정리되어, 마치 머릿속 지도를 얻는 것 같은 효과를 볼 수 있습니다. 결과물은 사람이 읽기 쉬운 HTML 형식과 다음 개발 단계에서 활용 가능한 JSON 형식으로 제공됩니다.
OpenAI가 "Codex"를 신규 사용자에게 2개월 동안 무료로 개방했습니다. 그동안 기업에서 AI 코딩을 본격 도입하려면 사용자 수만큼의
OpenAI가 신규 사용자들을 대상으로 'Codex'를 2개월간 무료로 개방했습니다. 이전에 기업에서 AI 코딩 기능을 도입하려면 사용자 수만큼의 시트 비용을 지불해야 했으나, 이번 기회를 통해 추가 비용 부담 없이 Codex의 다양한 기능을 활용할 수 있게 되었습니다.
와, Runway 일본 상륙
Runway가 일본 시장 확장을 공식 발표하며 도쿄 사무소를 개설하고 초기 4,000만 달러($40M)를 투자할 계획입니다. 이는 Runway의 가장 크고 빠르게 성장하는 시장 중 하나인 일본에 대한 전략적 움직임입니다. 또한, 지난 12개월 동안 일본 내 기업 고객 기반을 3배로 늘린 성과가 있었습니다.
이것이 무엇이 대단하냐면, ChatGPT 같은 「질문하면 답해주는 AI」가 아니라, 「뒤에서 계속 작업해 주는 AI」가 된다는 것입니다.
기존의 ChatGPT와 같은 질의응답형 AI를 넘어, 사용자의 뒤에서 지속적으로 업무를 수행하는 에이전트형 AI의 등장에 대해 설명합니다. 이 AI는 과거 이력, 로그인 정보, 위치, 개인적 취향 등을 종합적으로 참조하여 마치 전속 비서와 같은 역할을 수행합니다.
구글이 본격적으로 나서기 시작했다.
Google이 Google I/O에서 'Gemini Spark'라는 새로운 AI 에이전트를 발표할 예정입니다. 이는 24시간 365일 사용자를 대신하여 움직여주는 개인 비서 역할을 하는 AI로, 이메일 정리, 온라인 작업 대행, 연결된 앱 및 스킬 조작 등의 기능을 수행합니다.
자세한 내용은 이쪽에서
Google I/O 기간 중 사용자의 행동을 학습하고 다양한 앱 및 기술과 연동되는 새로운 Gemini Spark Agent가 공개될 예정입니다. 이 에이전트는 24시간 상시 대기하며 사용자의 일상적인 업무를 돕는 AI 어시스턴트 역할을 수행합니다.
너무 위험해.
serve-sim이라는 시뮬레이터가 공개되었으며, 이 도구는 비디오 파일을 카메라 입력으로 처리할 수 있게 합니다. 이는 기존의 iPhone 실기 과정 없이도 영상 데이터를 활용하여 AI 에이전트(Codex)를 클라우드 환경에서 헤드리스 방식으로 개발하고 여러 AI 모델을 병렬로 e2e 테스트하는 것을 가능하게 합니다.
이 피드 구독하기
본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.