Insights
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
X @githubprojects (자동 발견) 134건필터 해제

Sphere SDK, 자율 에이전트에게 신원, 지갑 및 P2P 양도성 증권 기반의 에이전트 간 탐색, 협상, 결제 능력 제공
Sphere SDK는 자율 에이전트가 신원 확인, 협상, 결제를 수행할 수 있도록 지원하는 개발 도구입니다. 암호화 객체와 P2P 원자적 스왑 기술을 통해 에이전트 간의 독립적인 자산 거래와 상호작용을 가능하게 합니다.
NVIDIA, 여러 플레이어가 동시에 존재할 수 있는 공유 세계를 생성하도록 AI 학습시켜
NVIDIA가 여러 에이전트가 동일한 환경에서 상호작용하며 일관성을 유지하는 'Gamma-World'를 개발했습니다. 이 기술은 단일 관점의 기존 세계 모델을 넘어, 다중 플레이어가 실시간으로 공유하는 시뮬레이션 환경을 구축합니다.

OmniVoice Studio: API 키 없이 로컬에서 실행되는 실시간 받아쓰기, Zero-shot 음성 복제 및 비디오 더빙용 오픈 소스
OmniVoice Studio는 API 키 없이 로컬에서 실행되는 오픈 소스 데스크톱 앱입니다. 실시간 받아쓰기, 3초 분량의 클립을 활용한 Zero-shot 음성 복제, 비디오 더빙 기능을 제공합니다.

openvid: 업로드 없이 시네마틱 효과를 적용할 수 있는 오픈 소스 브라우저 기반 비디오 편집기
openvid는 업로드 과정 없이 브라우저에서 직접 시네마틱 효과를 적용할 수 있는 오픈 소스 비디오 편집기입니다. 4K 내보내기, 3D 카메라 움직임, 멀티 트랙 오디오 제어 등 강력한 편집 기능을 제공합니다.

notebooklm-py: NotebookLM에 대한 프로그래밍 방식의 제어를 제공하는 비공식 Python API 및 CLI
notebooklm-py는 NotebookLM을 프로그래밍 방식으로 제어할 수 있게 해주는 비공식 Python API 및 CLI 도구입니다. 오디오 개요 생성, 학습 자료 다운로드, 연구 파이프라인 자동화 기능을 제공합니다.

FreeLLMAPI: 월 약 13억 토큰 규모의 12개 무료 LLM 제공업체 티어를 단일 OpenAI 호환 엔드포인트로 통합
FreeLLMAPI는 12개의 무료 LLM 제공업체를 단일 OpenAI 호환 엔드포인트로 통합하는 서비스입니다. 스트리밍, 도구 호출, 자동 장애 조치를 지원하며 base_url 변경만으로 기존 SDK와 연동할 수 있습니다.
LongLive 2.0: NVIDIA의 NVFP4 양자화 및 병렬 처리를 활용한 장기 비디오 생성 가속 인프라
LongLive 2.0은 NVFP4 양자화와 병렬 처리 기술을 활용하여 장기 비디오 생성의 속도를 혁신적으로 높이는 NVIDIA 인프라입니다. W4A4 및 KV 캐시 양자화, 시퀀스 병렬 처리를 통해 효율적인 훈련과 추론을 지원합니다.
배경 제거에 비용을 지불하지 마세요. 모든 API가 사용하는 모델은 오픈 소스입니다.
본 기사는 배경 제거(background removal) API가 사용하는 핵심 모델인 BiRefNet을 소개하며, 이 모델이 오픈 소스임을 강조합니다. 사용자는 HuggingFace를 통해 쉽게 로드하고 배치 추론에 활용할 수 있으며, 브라우저 기반의 오프라인 AI 이미지 툴킷 Removerized도 함께 제공됩니다.

개발자들은 수년간 취약한 의존성(dependencies)을 걱정해 왔습니다.
npm, PyPI, Rust crates를 대상으로 하는 새로운 'TrapDoor' 악성 코드 캠페인이 발견되었습니다. 설치 스크립트와 셸 실행 등을 통해 자격 증명을 탈취하거나 가상자산 지갑을 공격하는 수법을 사용합니다.

OpenWA: 호출당 비용 없이 자체 인프라에서 다중 계정을 실행할 수 있는 오픈 소스 WhatsApp API 게이트웨이
OpenWA는 자체 인프라에서 다중 WhatsApp 계정을 비용 없이 운영할 수 있는 오픈 소스 API 게이트웨이입니다. 플러그형 아키텍처와 Docker 네이티브 배포를 지원하며, 세션 관리를 위한 React 대시보드도 제공합니다.
annyang: 브라우저 내장 Speech Recognition API를 사용하여 모든 사이트에 음성 명령 제어를 추가하는 2 KB
annyang은 브라우저 내장 Speech Recognition API를 활용하여 웹사이트에 음성 명령 제어 기능을 추가하는 2 KB 규모의 경량 JavaScript 라이브러리입니다. 의존성 없이 작동하며 키워드 매칭과 와일드카드를 통해 간편하게 명령을 정의할 수 있습니다.
D2: 일반 텍스트를 아키텍처 다이어그램으로 변환하는 다이어그램 스크립팅 언어
D2는 일반 텍스트를 아키텍처 다이어그램으로 변환해주는 스크립팅 언어입니다. CLI 도구를 통해 .d2 파일을 SVG로 실시간 렌더링하며, 다양한 레이아웃 엔진과 테마를 지원합니다.
Rust에서의 GPU 프로그래밍은 항상 두 가지 중 하나를 의미해 왔습니다: Rust처럼 보이지만 실제로는 아닌 DSL, 또는 C++ CUDA
Rust에서 GPU 프로그래밍을 구현할 때 기존의 DSL 방식이나 C++ CUDA FFI 바인딩 방식 대신, 표준 Rust 코드를 PTX로 직접 컴파일할 수 있는 cuda-oxide가 등장했습니다. 이 도구는 커스텀 rustc codegen 백엔드를 통해 Rust의 소유권, 트레이트, 제네릭과 같은 핵심 기능을 GPU 커널 작성 시 그대로 사용할 수 있게 해줍니다.
designmd.sh 서비스 출시: DESIGN.md 파일을 위한 최초의 공개 레지스트리
VoltAgent 팀이 AI 에이전트의 출력 형식을 정의하기 위한 최초의 공개 레지스트리인 designmd.sh를 출시했습니다. 이 서비스는 레이아웃, 타이포그래피, UI 키트 등 재사용 가능한 디자인 시스템을 담은 DESIGN.md 파일을 탐색하고 워크플로에 활용할 수 있도록 지원합니다.
모든 에이전트 워크플로우는 한 번에 하나의 도구로만 회사 데이터에 접근합니다. Coral은 이를 뒤집습니다...
Coral은 기존 에이전트 워크플로우가 한 번에 하나의 도구로만 데이터에 접근하던 한계를 극복하여, 단일 SQL 문장으로 다양한 플랫폼의 데이터를 통합 쿼리할 수 있게 합니다. GitHub, Slack, Stripe 등 여러 소스 간의 JOIN을 지원하며 인증, 페이지네이션, 속도 제한 등의 복잡한 과정을 내부적으로 자동 처리합니다.
코딩 에이전트(Coding agents)를 위한 사전 인덱싱된 코드 지식 그래프 (Knowledge graph). 더 적은 토큰. 더 적은
코딩 에이전트의 효율성을 높이기 위해 사전 인덱싱된 코드 지식 그래프를 활용하는 기술을 소개합니다. 이를 통해 토큰 사용량과 도구 호출 횟수를 줄이면서도 100% 로컬 환경에서 동작할 수 있습니다.
이미지 생성에는 클러스터가 필요했습니다. SANA는 16GB 노트북에서 4096x4096 해상도를 실행합니다.
SANA는 0.6B 파라미터를 가진 경량화된 이미지 생성 모델로, 선형 어텐션과 32배 잠재 압축 기술을 통해 고해상도 생성을 지원합니다. 이를 통해 16GB 메모리 노트북에서도 4096x4096 해상도를 실행할 수 있으며, 4비트 양자화 시 8GB 미만의 환경에서도 구동이 가능합니다.
모든 AI 도구를 위한 정밀한 프롬프트(Prompt)를 작성하는 스킬. 대상 탐지...
이 글은 모든 AI 도구에 적용할 수 있는 정밀한 프롬프트 작성 스킬을 다룹니다. 핵심 내용은 특정 대상(Cursor, Midjourney, Claude Code, GPT, Stable Diffusion 등)을 정확히 탐지하고, 그에 맞는 적절한 프레임워크를 선택하며, 불필요한 토큰을 제거하여 최적화된 하나의 블록으로 출력하는 방법을 제시합니다.
인증서, 서명 및 Apple ID를 통한 설치를 처리하는 오픈 소스, 크로스 플랫폼 iOS 사이드로딩 (sideloading) 앱…
이 오픈 소스 크로스 플랫폼 iOS 사이드로딩 앱은 Apple ID를 활용하여 인증서, 서명 및 설치 과정을 처리할 수 있습니다. 이 도구는 ElleKit을 통한 트윅(tweaks) 지원과 페어링 파일 생성 기능을 제공합니다. macOS, Linux, Windows 등 다양한 운영체제에서 작동하는 것이 특징입니다.
회의에 대한 완전한 제어권을 원하는 개발자와 팀을 위해 구축된 오픈 소스 Zoom 대안
이 오픈 소스 솔루션은 개발자와 팀에게 완전한 회의 제어권을 제공하는 Zoom 대안입니다. 사용자가 직접 호스팅하고, 커스터마이징하며, 확장할 수 있도록 설계되었습니다. 화면 공유, 채팅, 녹화, 라이브 스트리밍, 종단간 암호화 등 필수 기능을 모두 지원합니다.
이 피드 구독하기
본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.