본문으로 건너뛰기

© 2026 Molayo

Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

GitHub Trending Python (daily) 145필터 해제

GH Trending릴리즈

Blaizzy/mlx-vlm

mlx-vlm은 MLX 프레임워크를 활용하여 Mac 환경에서 Vision Language Models (VLMs) 및 Omni Models(오디오/비디오 지원 VLM)의 추론과 미세 조정에 사용되는 패키지입니다. 이 도구는 CLI와 Python API를 통해 모델을 쉽게 로드하고, 텍스트 생성 외에도 멀티 이미지 채팅, Thinking Mode 활성화, 그리고 속도 향상을 위한 Speculative Decoding(Drafter) 기능을 제공합니다. 특히, 'Thinking Mode'를 통해 복잡한 추론 과정을 명시적으로 관리할 수 있으며, MTP와 같은 고급 Drafter 기법을 적용하여 생성 속도를 크게 향상시키는 것이 특징입니다.

5월 7일9
GH Trending릴리즈

awslabs/aidlc-workflows

AI-DLC(Artificial Intelligence - Development Lifecycle Control)는 사용자의 요구에 맞춰 적응하며 품질 기준을 유지하고 개발 프로세스를 통제하는 지능형 소프트웨어 개발 워크플로우입니다. 이 가이드는 AI-DLC 규칙 세트를 로컬 프로젝트 환경에 설정하는 구체적인 방법을 안내합니다. 사용자들은 Kiro IDE나 Amazon Q Developer와 같은 코딩 에이전트 및 플랫폼 설정을 통해 AI-DLC를 통합하여, 생성형 AI의 잠재적 오류를 관리하고 개발 과정을 체계적으로 관리할 수 있습니다.

5월 7일5
GH Trending릴리즈

Open-LLM-VTuber/Open-LLM-VTuber

Open-LLM-VTuber는 실시간 음성 대화, 시각 인식, 그리고 생동감 있는 Live2D 아바타 기능을 결합한 독특한 AI 상호작용 플랫폼입니다. 이 시스템은 모든 기능이 오프라인으로 구동 가능하며, 사용자가 원하는 캐릭터의 외모와 성격(페르소나)을 커스터마이징할 수 있습니다. 웹 버전과 데스크톱 클라이언트 모드를 모두 지원하여, 투명 배경의 애완 동물 모드 등 다양한 환경에서 AI 동반자와 상호작용할 수 있도록 설계되었습니다.

5월 7일11
GH Trending릴리즈

CPU 기반 경량 텍스트 음성 변환 (TTS) 애플리케이션: Pocket TTS

Pocket TTS는 CPU 환경에 최적화된 경량 텍스트-음성 변환(TTS) 애플리케이션으로, 별도의 GPU나 복잡한 웹 API 설정 없이도 간단한 Python 호출이나 CLI를 통해 오디오 생성이 가능합니다. 이 모델은 작은 크기(100M 파라미터)에도 불구하고 낮은 지연 시간과 높은 실시간 처리 속도를 자랑하며, 다국어 지원 및 음성 클로닝 기능까지 제공하여 범용성이 뛰어납니다. 사용자는 `pocket-tts generate` 명령어나 Python 라이브러리 호출을 통해 텍스트를 오디오 파일로 변환할 수 있으며, 로컬 서버(`serve`) 기능을 이용해 웹 인터페이스에서도 쉽게 접근할 수 있습니다.

5월 6일7
GH Trending릴리즈

alexgreensh/token-optimizer — 고스트 토큰 찾기, 수정, 압축 생존

이 기술 기사는 'token-optimizer'라는 도구를 소개하며, 텍스트 데이터 내에 존재하는 '고스트 토큰(ghost tokens)'을 식별하고 수정하는 방법을 다룹니다. 이 과정을 통해 모델의 압축 과정에서 발생할 수 있는 컨텍스트 품질 저하를 방지하고, 전반적인 정보 처리 효율성을 높이는 것을 목표로 합니다. 핵심적으로는 데이터 최적화와 정제 작업을 수행하여 AI 모델이 더 정확하고 풍부한 정보를 바탕으로 작동하도록 돕습니다.

5월 6일6
GH Trending릴리즈

raullenchai/Rapid-MLX — Apple Silicon 최고속 로컬 AI 엔진

Rapid-MLX는 Apple Silicon 환경에 최적화된 고성능 로컬 AI 엔진입니다. Ollama 대비 월등히 빠른 속도를 자랑하며, 특히 낮은 TTFT(Time To First Token)와 높은 도구 호출 성공률을 통해 사용자 경험과 기능성을 극대화했습니다. 이 엔진은 프롬프트 캐싱 및 17개의 도구 파서를 통합하여 효율적이고 강력한 로컬 AI 구동 환경을 제공합니다.

5월 6일10
GH Trending릴리즈

OpenBMB/VoxCPM

OpenBMB/VoxCPM은 토크나이저(tokenizer)를 사용하지 않는 혁신적인 다국어 텍스트-음성 변환(TTS) 모델입니다. 이 모델은 단순한 음성 합성을 넘어, 크리에이티브한 보이스 디자인과 고품질의 실감 나는 보이스 클로닝 기능을 제공합니다. 따라서 다양한 언어와 목적에 맞는 전문적이고 창의적인 음성 콘텐츠 제작이 가능합니다.

5월 6일11
GH Trending릴리즈

LearningCircuit/local-deep-research — SimpleQA 벤치마크 95% 달성 로컬 딥 리서치

이 프로젝트는 SimpleQA 벤치마크에서 약 95%의 높은 성능을 달성한 로컬 기반 심층 연구 도구입니다. Ollama, Google, Anthropic 등 다양한 플랫폼의 LLM을 지원하며, arXiv, PubMed, 웹 등 10개 이상의 소스에서 정보를 검색하여 깊이 있는 답변 생성을 가능하게 합니다.

5월 6일8
GH Trending릴리즈

YILING0013/AI_NovelGenerator — AI로 다장절 장편소설 자동 생성, 맥락/복선 자동 연결

이 프로젝트는 인공지능(AI)을 활용하여 방대한 분량의 장편 소설을 자동으로 생성하는 시스템입니다. 단순히 텍스트를 이어 붙이는 것을 넘어, 이야기의 앞뒤 맥락을 유지하고 복선(foreshadowing)을 자연스럽게 연결하며 서사를 구축하는 것이 핵심 기능입니다.

5월 6일5
GH Trending릴리즈

conorluddy/ios-simulator-skill — Claude Code용 iOS 시뮬레이터 스킬

이 기술 기사는 Claude Code를 위한 'iOS 시뮬레이터 스킬'을 소개합니다. 이 스킬은 앱 빌드, 실행 및 상호작용 능력을 최적화하여 제공하며, 주로 `xcodebuild` 래퍼 형태로 구현되어 복잡한 개발 환경의 컨텍스트(context) 절약을 목표로 합니다.

5월 6일7
GH Trending릴리즈

Fooocus - 오프라인 이미지 생성 소프트웨어

Fooocus는 Midjourney와 같은 온라인 서비스의 복잡한 조작 없이도 고품질 이미지를 생성할 수 있도록 설계된 오프라인, 오픈 소스 이미지 생성 소프트웨어입니다. Stable Diffusion XL 아키텍처를 기반으로 하며, 사용자가 프롬프트 입력과 이미지에만 집중할 수 있도록 간소화된 사용자 경험을 제공합니다. 이 소프트웨어는 설치가 매우 간단하며, 특히 인페인팅 및 업스케일링 기능에서 뛰어난 성능을 보여줍니다.

5월 6일12
GH Trending릴리즈

Lightricks/LTX-2

Lightricks에서 공개한 LTX-2는 텍스트나 오디오 입력을 기반으로 비디오를 생성하는 고급 오디오-비디오 생성 모델입니다. 이 레포지토리는 해당 모델을 공식적으로 추론하고 사용자 정의 학습(LoRA)을 수행할 수 있는 Python 패키지를 제공합니다. 개발자들은 이를 통해 고품질의 미디어 콘텐츠 제작 파이프라인을 구축하고, 특정 도메인에 맞게 모델을 미세 조정할 수 있습니다.

5월 6일16
GH Trending릴리즈

microsoft/TRELLIS

TRELLIS는 확장 가능하고 다목적인 3D 콘텐츠 생성을 목표로 하는 구조화된 3D 잠재변수(Structured 3D Latents)를 제안하는 연구입니다. 이 기술은 CVPR 25 Spotlight에 발표된 논문을 기반으로 하며, 3D 생성 분야의 새로운 패러다임을 제시합니다. TRELLIS는 다양한 종류의 3D 데이터를 효율적으로 다루고 고품질의 결과물을 만들어낼 수 있도록 설계되었습니다.

5월 6일6
GH Trending릴리즈

Hiddify-Manager: 강력한 검열 회피 도구 소개

Hiddify-Manager는 Reality, Telegram proxy를 포함하여 20개 이상의 프로토콜을 지원하는 강력하고 전문적인 검열 회피 도구입니다. 다중 사용자 패널 기능을 제공하며 중국, 러시아, 이란 등 특정 지역의 검열 우회에 최적화되어 있습니다. Xray와 SingBox 기반으로 구축되었으며, 자동 업데이트, 클라우드플레어 CDN 연결, 세밀한 사용자별 트래픽 및 시간 제한 기능 등을 통해 안전하고 간편하게 인터넷 사용을 보장합니다.

5월 5일6
GH Trending릴리즈

myshell-ai/OpenVoice

OpenVoice는 정확한 톤 컬러 클로닝, 유연한 음성 스타일 제어, 그리고 Zero-shot 크로스 언어 음성 클로닝 기능을 제공하는 강력한 인스턴트 음성 클로닝 모델입니다. OpenVoice V2가 출시되면서 오디오 품질이 향상되었고, 영어, 스페인어, 프랑스어, 중국어, 일본어, 한국어를 포함한 네이티브 다국어 지원을 갖추게 되었습니다. 또한, V1과 V2 모두 MIT 라이선스로 상업적 및 연구 사용에 무료로 제공됩니다.

5월 5일11
GH Trending릴리즈

Open Wearables: 다중 웨어러블 데이터 통합 및 AI 기반 건강 인사이트 플랫폼

Open Wearables는 다중 웨어러블 기기(Garmin, Whoop, Apple Health 등)의 데이터를 통합하고 정규화된 형태로 제공하는 오픈소스 플랫폼입니다. 이 플랫폼은 단일 API를 통해 여러 데이터 소스를 연결하며, 개발자가 복잡한 OAuth 및 데이터 매핑 과정을 거치지 않고도 건강 애플리케이션을 신속하게 구축할 수 있도록 돕습니다. 또한, 자연어 처리와 AI 기능을 활용하여 단순한 데이터 집계를 넘어선 지능적인 개인 건강 인사이트와 자동화된 알림 시스템을 제공합니다.

5월 5일6
GH Trending릴리즈

OWASP/Nettacker

OWASP Nettacker는 사이버 보안 전문가와 윤리적 해커를 위해 설계된 오픈 소스 자동 침투 테스트 및 정보 수집 프레임워크입니다. 이 도구는 포트 스캔, 서브도메인 열거, 취약점 검사, 인증서 강제로 테스트 등 다양한 작업을 모듈식으로 자동화하여 네트워크, 웹 애플리케이션, IoT 기기 등의 약점을 효율적으로 식별할 수 있게 합니다. 또한, CI/CD 파이프라인 통합을 위한 데이터베이스 기능과 CLI, REST API, 웹 UI를 제공하여 지속적인 보안 감사 및 자산 관리에 최적화되어 있습니다.

5월 4일8
GH Trending릴리즈

TimesFM (Time Series Foundation Model) 소개 및 설치 가이드

TimesFM은 Google Research에서 개발한 시계열 예측을 위한 사전 학습된 파운데이션 모델입니다. 최신 버전인 2.5는 이전 버전에 비해 매개변수 수를 줄이고, 컨텍스트 길이를 최대 16k까지 확장했으며, 연속 분위수 예측(continuous quantile forecast) 기능을 추가했습니다. 사용자는 Hugging Face Transformers와 PEFT를 활용한 파인튜닝 예제 및 XReg을 통한 공변량 지원 등 다양한 개선 사항을 이용할 수 있습니다.

5월 4일8
GH Trending릴리즈

Ouroboros

Ouroboros는 AI 코딩 워크플로우를 위한 Agent OS입니다. 이 도구는 모호한 아이디어를 구조화된 'Specification-first' 실행 계약으로 변환하여, 비결정론적인 AI 에이전트 작업을 재현 가능하고 관찰 가능한 형태로 만듭니다. 사용자는 단순 프롬프팅 대신 소크라틱 인터뷰와 불변의 시드 스펙을 통해 명확한 의도를 정의하고, 자동화된 평가 게이트를 거쳐 검증된 작동 가능한 코드베이스를 얻게 됩니다.

5월 3일10
GH Trending릴리즈

HKUDS/AI-Trader

AI-Trader는 AI 에이전트를 위한 네이티브 거래 플랫폼으로, 사용자들이 자신의 아이디어를 교환하고 다양한 거래 기술을 연마할 수 있도록 설계되었습니다. 이 플랫폼은 OpenClaw, Claude Code 등 주요 AI 에이전트들을 즉시 통합하여 지원하며, 집단 지성 기반의 토론, 원클릭 복사 거래, 그리고 주식/암호화폐/외환 등 범용 시장 접근을 제공합니다. 또한, 사용자는 신호를 게시하고 팔로워를 얻어 보상 시스템을 통해 활동적인 커뮤니티 참여와 수익 창출 기회를 얻을 수 있습니다.

5월 3일17

이 피드 구독하기

본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.