Insights
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
X @githubprojects (자동 발견) 134건필터 해제
WhisperX: 배치형 whisper 파이프라인을 사용한 정확한 단어 단위 타임스탬프 및 화자 분리 기능을 갖춘 빠른 자동 음성 인식
WhisperX는 배치형 Whisper 파이프라인을 활용하여 빠른 속도와 정확한 단어 단위 타임스탬프를 제공하는 ASR 도구입니다. wav2vec2와 pyannote-audio를 결합하여 화자 분리 및 환각 현상 감소 기능을 갖추었습니다.

nanoGPT는 OpenWebText에서 GPT-2 (124M) 성능을 재현하는 약 300줄 규모의 최소한의 GPT 학습 루프를 제공합니다.
nanoGPT는 GPT-2(124M) 성능을 재현할 수 있는 약 300줄 규모의 최소한의 GPT 학습 루프를 제공합니다. 깔끔한 코드베이스를 통해 모델 학습 및 커스텀 데이터셋 학습을 용이하게 지원합니다.

LLaMA Factory를 통해 코드 없이 CLI 또는 Web UI로 100개 이상의 LLM을 미세 조정(Fine-tuning)할 수 있습니다.
LLaMA Factory는 코드 없이 CLI 또는 Web UI를 통해 100개 이상의 LLM을 미세 조정할 수 있는 도구입니다. Full, LoRA, QLoRA 등 다양한 학습 방식을 지원하며 클라우드 플랫폼과도 통합됩니다.

PCC 펌웨어 내 Apple의 vphone600AP 컴포넌트를 사용하여 Metal 가속이 적용된 가상 iPhone을 부팅할 수 있습니다.
Apple의 PCC 펌웨어 내 vphone600AP 컴포넌트를 활용하여 Metal 가속이 적용된 가상 iPhone을 부팅하는 기술을 소개합니다. 기존 QEMU 에뮬레이션보다 빠르고 부드러운 실행 성능을 제공하며 터치 상호작용까지 지원합니다.

Chunkr: PDF, PPT, Word 및 이미지를 RAG 및 LLM 파이프라인을 위한 구조화된 청크로 변환하는 오픈 소스 문서 인텔리전스
Chunkr는 PDF, PPT, Word 및 이미지를 RAG와 LLM 파이프라인에 최적화된 구조화된 청크로 변환해주는 오픈 소스 문서 인텔리전스 서비스입니다. 레이아웃 분석과 OCR을 통해 HTML 및 Markdown 형식의 출력을 지원합니다.
픽셀 수준에서 해결된 그린 스크린 키잉 (Green screen keying)
Corridor의 neural keyer는 픽셀 수준에서 그린 스크린 키잉을 처리합니다. 전경 색상과 선형 알파를 정밀하게 분리하여 EXR 형식으로 출력할 수 있습니다.
Transformer에서 현대적 추론 모델까지, LLM 논문, 프레임워크 및 도구 큐레이션 목록
Transformer부터 DeepSeek-R1에 이르기까지 LLM의 발전을 다루는 주요 논문, 프레임워크, 도구들을 정리한 큐레이션 목록입니다. 학습 프레임워크, 추론 도구, 평가 리소스 및 교육 자료를 포괄적으로 제공합니다.

CCometixLine: Git 통합, 사용량 추적 및 TUI 설정 인터페이스를 갖춘 Claude Code용 Rust 기반 상태
CCometixLine은 Claude Code 사용자를 위한 Rust 기반의 상태 표시줄 도구입니다. Git 통합, 사용량 추적, TUI 설정 인터페이스를 제공하여 개발 환경의 편의성을 높여줍니다.

CCometixLine: Git 통합, 사용량 추적 및 TUI 설정 인터페이스를 갖춘 Claude Code용 Rust 기반 상태
CCometixLine은 Claude Code 사용자를 위한 Rust 기반의 상태 표시줄 도구입니다. Git 통합, 사용량 추적, TUI 설정 인터페이스를 제공하여 개발 환경의 편의성을 높여줍니다.

CCometixLine: Git 통합, 사용량 추적 및 TUI 설정 인터페이스를 갖춘 Claude Code용 Rust 기반 상태
CCometixLine은 Claude Code 사용자를 위한 Rust 기반의 상태 표시줄 도구입니다. Git 통합, 사용량 추적, TUI 설정 인터페이스를 제공하여 개발 환경의 편의성을 높여줍니다.

OpenMVG는 읽기 쉽고 테스트 주도적인 구현을 기반으로 이미지로부터 재현 가능한 3D 재구성 (3D reconstruction)을 위한
OpenMVG는 이미지로부터 재현 가능한 3D 재구성을 지원하는 C++ 프레임워크입니다. 특징점 검출부터 구조 복원까지 엔드 투 엔드 파이프라인을 제공하며 다양한 OS에서 실행 가능합니다.

ItyFuzz: 심볼릭 실행(Symbolic Execution)과 퍼징(Fuzzing)을 결합하여 스마트 컨트랙트의 버그를 찾는 EVM 및
ItyFuzz는 심볼릭 실행과 퍼징을 결합하여 EVM 및 MoveVM 기반 스마트 컨트랙트의 취약점을 찾는 하이브리드 퍼저입니다. 기존 도구인 Echidna보다 훨씬 많은 취약점을 발견하며, 높은 성능과 다양한 익스플로잇 생성 기능을 제공합니다.

로컬 개발 환경에서 여러 서비스를 통합하기 위한 Docker Compose 샘플 큐레이션 모음
로컬 개발 환경에서 다양한 기술 스택을 통합하기 위한 Docker Compose 샘플 모음입니다. Go, React, Rust 등 다양한 언어와 데이터베이스, 메시지 브로커를 포함한 설정 예시를 제공합니다.

Wasp: 최소한의 보일러플레이트(boilerplate)로 풀스택 앱을 컴파일하는 React, Node.js, Prisma용 Rails 스타일
Wasp는 React, Node.js, Prisma를 기반으로 풀스택 애플리케이션을 빠르게 구축할 수 있게 돕는 Rails 스타일의 프레임워크입니다. 단일 명세 파일로 앱을 정의하며 인증, RPC, 작업 관리 등 핵심 기능을 내장하고 있습니다.

Chat UI: 모든 OpenAI 호환 API와 연동되는 SvelteKit 기반 채팅 인터페이스
SvelteKit을 기반으로 구축된 OpenAI 호환 채팅 인터페이스입니다. llama.cpp, Ollama, OpenRouter 등 다양한 API 엔드포인트와 연동하여 사용할 수 있습니다.
Headscale-UI: CORS 문제를 해결하기 위해 동일한 서브도메인에서 실행되는 Headscale용 웹 프론트엔드 제공
Headscale의 CORS 문제를 해결하기 위해 동일한 서브도메인에서 실행되는 웹 프론트엔드를 제공합니다. 정적 사이트 형태로 배포가 가능하며 다양한 웹 서버 및 리버스 프록시 설정을 지원합니다.

상세한 설명과 복잡도 분석을 포함하여 JavaScript로 구현된 JavaScript 알고리즘 및 자료구조
JavaScript로 구현된 다양한 알고리즘과 자료구조를 제공하는 리포지토리입니다. 초급부터 고급 수준까지 연결 리스트, 트리, 그래프, 동적 계획법 등 핵심 개념을 상세한 설명과 복잡도 분석을 포함하여 다룹니다.
PKCE를 포함한 OAuth 2.1 프로바이더 측 구현 TypeScript 라이브러리: Cloudflare Workers를 활용한 토큰 관리
Cloudflare Workers를 활용하여 OAuth 2.1 프로바이더를 구현할 수 있는 TypeScript 라이브러리를 소개합니다. PKCE를 포함한 토큰 관리와 권한 부여 과정을 자동화하여 개발 편의성을 높였습니다.

Amphion: 클래식 모델의 시각화와 함께 오디오, 음악, 음성 생성을 위한 재현 가능한 연구를 지원하는 오픈 소스 툴킷
Amphion은 오디오, 음악, 음성 생성 연구를 지원하는 오픈 소스 툴킷입니다. 클래식 모델의 시각화와 재현 가능한 연구 환경을 제공하며, 다양한 생성 태스크와 통합 프레임워크를 포함합니다.

Outlines: 생성 전 LLM의 출력 구조를 정의하여 사후 처리 없이 유효한 JSON, 스키마 또는 문법을 보장합니다
Outlines는 LLM의 출력 구조를 생성 단계에서 정의하여 유효한 JSON이나 스키마를 보장하는 라이브러리입니다. 사후 처리 없이도 Pydantic 모델 등을 통해 정확한 형식을 유지하며, 다양한 모델 공급자와 호환됩니다.
이 피드 구독하기
본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.