Insights
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
X @socialwithaayan (자동 발견) 87건필터 해제

인터넷에서 가장 똑똑한 사람들이 방금 자신들의 두뇌를 오픈 소스로 공개했습니다.
AI 에이전트 구축, 연구 자동화, 코딩 기술 등 개발자에게 유용한 11개의 핵심 GitHub 오픈 소스 저장소를 소개합니다. Karpathy의 지혜부터 Microsoft의 퀀트 플랫폼까지 폭넓은 기술 자산을 다룹니다.

Microsoft Research 연구원이 Claude Code 사용자들이 기피해 온 문제를 해결했습니다.
Microsoft Research 연구원이 개발한 SkillOpt는 Claude Code의 스킬 파일을 자동으로 최적화하는 오픈 소스 도구입니다. 마크다운 문서를 학습 대상으로 삼아 에이전트의 작업 궤적을 분석하고, 성능이 개선될 때까지 스킬 파일을 자동으로 편집합니다.

대부분의 AI 개발자가 아직 보지 못한 24,600 스타의 GitHub 저장소를 발견했습니다
OpenBMB와 Tsinghua University가 개발한 1.3B 파라미터 규모의 멀티모달 모델 MiniCPM-V 4.6을 소개합니다. 이 모델은 클라우드 API 없이 스마트폰 등 온디바이스 환경에서 이미지, 비디오, OCR 작업을 수행할 수 있는 오픈 소스 모델입니다.

6개월 동안 수집한 모든 Claude 팁 100가지를 한 페이지에 정리했습니다
6개월간 수집한 Claude 활용 팁 100가지를 정리한 가이드입니다. 설정, 프롬프팅, Claude Code 사용법, MCP 커넥터, 에이전트 활용 등 파워 유저를 위한 핵심 노하우를 담고 있습니다.
Paris 2.0, 아무것도 공유하지 않는 분산 GPU 풀을 통해 비디오 생성 모델 학습
Paris 2.0은 데이터와 파라미터를 공유하지 않는 분산 GPU 풀을 통해 비디오 생성 모델을 학습하는 데 성공했습니다. 중앙 집중식 학습의 가설을 깨고 동일 예산 대비 성능을 2배 향상시키며 구조적 변화의 가능성을 제시했습니다.
AI 비디오 도구 사용 경험과 캐릭터 일관성 문제
다양한 AI 비디오 도구를 사용해 본 경험을 바탕으로 캐릭터 일관성 문제를 지적합니다. Flovaai Skills는 참조 이미지를 업로드하고 프롬프트만 입력하면, 영화 같은 카메라 언어와 움직임을 자동으로 처리하여 이 문제를 해결하는 것을 보여주었습니다.
세상에.. 이건 불가능해야 합니다
OpenBMB가 개발한 MiniCPM-5 1B는 온디바이스 AI 환경에 최적화된 10억 파라미터 규모의 경량 모델입니다. 브라우저와 모바일 등 다양한 환경에서 로컬 실행이 가능하며, AI가 직접 작성한 훈련 프레임워크인 ForgeTrain을 통해 학습되었습니다.

오늘 아침 읽지 않은 이메일이 500통 있었습니다.
Claude를 Gmail과 연결하여 이메일 관리 자동화 워크플로우를 구축하는 방법을 소개합니다. 스캔, 분류, 일괄 보관, 요약, 초안 작성 등 7단계의 단계를 통해 수백 통의 이메일을 단 5분 만에 처리할 수 있습니다.
실제 회사처럼 운영되는 AI 워크포스(Workforce)를 구축할 수 있는 GitHub 저장소를 발견했습니다. 방금 출시되었습니다.
Alook은 AI 에이전트들에게 직함과 보고 체계를 부여하여 실제 조직처럼 운영할 수 있는 오픈 소스 GitHub 저장소입니다. 에이전트 간 이메일 통신, 공유 메모리, 자동 SOP 구축 기능을 통해 자율적인 AI 워크포스를 구현합니다.

실제로 유용한 60개의 GitHub 저장소
개발자에게 실질적인 도움이 되는 60개의 유용한 GitHub 저장소를 소개합니다. 일반적인 프로그래밍 학습 리소스부터 최신 AI 에이전트, RAG 엔진, 로컬 LLM 실행 도구까지 폭넓은 오픈소스 리스트를 포함하고 있습니다.
MiniMax가 새로운 sparse attention 아키텍처를 갖춘 M3를 공개했습니다
MiniMax가 새로운 sparse attention 아키텍처를 적용한 M3 모델을 공개했습니다. M3는 1M 토큰 기준 prefilling 속도가 9.7배, decoding 속도가 15.6배 향상되어 이전 모델인 M2를 크게 뛰어넘는 성능을 보여줍니다.
Google과 Microsoft가 모든 AI 코딩 에이전트의 최악의 습관을 고치기 위해 협력했습니다.
Google과 Microsoft가 AI 코딩 에이전트가 레거시 코드를 생성하는 문제를 해결하기 위해 'Modern Web Guidance'를 발표했습니다. 이는 에이전트가 최신 표준을 따르도록 유도하여 코드 품질을 개선하는 데 목적이 있습니다.
와.. Qwen이 LiveTranslate를 출시했습니다. 실시간 번역의 패러다임이 완전히 바뀔 것입니다.
Qwen이 실시간 번역 서비스인 LiveTranslate를 출시하며 번역 기술의 새로운 패러다임을 제시했습니다. 이 서비스는 3,500개 이상의 언어 쌍 지원, 실시간 음성 복제, 시각적 접지 기능을 통해 초저지연 실시간 번역을 제공합니다.
세상에... 3,200만 달러를 투자받은 회사가 제품 전체를 오픈 소스로 공개했습니다.
3,200만 달러의 투자를 유치한 Cal.com 팀이 자사의 스케줄링 플랫폼을 오픈 소스로 공개했습니다. 이번 공개된 'cal.diy' 버전은 엔터프라이즈 및 상업용 코드를 모두 제거한 상태이며, MIT 라이선스 하에 배포됩니다.
가격 책정은 오늘날 AI 스타트업이 직면한 가장 어려운 문제 중 하나입니다.
AI 스타트업이 직면한 가장 까다로운 과제 중 하나인 가격 책정 전략에 대해 다룹니다. 모든 서비스가 결과 기반 가격 책정으로 전환될 것이라는 예측과 달리, 실제 시장 상황은 더 복잡하며 다양한 모델이 존재함을 시사합니다.
아직 아무도 AI가 이런 일을 할 수 있다고 말해주지 않았습니다. 저는 완전한 이커머스 (eCommerce) 제품 광고를 만들었습니다...
단 두 개의 AI 도구만을 활용하여 완전한 이커머스 제품 광고를 제작하는 혁신적인 워크플로우를 소개합니다. 기존에 알려지지 않았던 AI 기반의 효율적인 광고 제작 프로세스를 공유합니다.
속보: 인터넷의 모든 봇 탐지 테스트를 통과하는 스텔스 Chromium 브라우저가 오픈 소스로 공개되었습니다.
모든 봇 탐지 테스트를 통과할 수 있도록 설계된 오픈 소스 스텔스 Chromium 브라우저인 CloakBrowser가 공개되었습니다. 이 프로젝트는 단순한 래퍼가 아니라 C++ 레벨에서 Chromium 소스 코드를 직접 수정하여 Canvas 및 WebGL 등의 지문을 우회합니다.
사용된 도구: GPT Image 2를 활용한 스토리보드 제작 및 Seedance 2.0을 통한 시네마틱 비디오 생성
GPT Image 2를 사용하여 참조 이미지를 기반으로 3x3 스토리보드를 구축하고, Seedance 2.0을 통해 이를 시네마틱 비디오로 변환하는 워크플로우를 소개합니다. 제품 이미지를 업로드하고 프롬프트를 입력함으로써 캐릭터와 장면을 구성하는 단계별 과정을 다룹니다.
수동 에이전트 관리의 시대는 끝났습니다. LobeHub가 Chief Agent를 출시했습니다.
LobeHub가 에이전트 관리를 자동화하는 'Chief Agent Operator'를 출시했습니다. 이 서비스는 기술 마켓플레이스에서 에이전트를 고용하고, 클라우드에서 24시간 실행하며, Slack이나 Discord를 통해 작업 결과를 보고하는 기능을 제공합니다.
프리랜싱의 모든 과정을 아우르는 25가지 Claude 명령어
프리랜서들이 기술적 역량 외에 비즈니스 운영 과정에서 겪는 어려움을 해결하기 위해 설계된 25가지 Claude 프롬프트를 소개합니다. 클라이언트 발굴을 포함하여 프리랜싱의 전 과정을 효율적으로 관리할 수 있도록 돕는 명령어 모음입니다.
이 피드 구독하기
본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.