Insights
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
GitHub Trending Python (weekly) 15건필터 해제
Agent Skills: AI 에이전트가 특정 작업을 수행할 수 있도록 발견하고 사용할 수 있는 지침, 스크립트 및 리소스의 폴더
Agent Skills는 AI 에이전트가 특정 작업을 수행할 수 있도록 돕는 지침, 스크립트 및 리소스를 모아둔 폴더입니다. 이는 'Write once, use everywhere' 원칙을 적용하여 다양한 환경에서 재사용 가능한 기능을 제공합니다. 사용자는 `skill-installer` 명령어를 통해 필요한 커리레이션되거나 실험적인 스킬들을 Codex에 쉽게 설치하고 관리할 수 있습니다.
lsdefine/GenericAgent
lsdefine/GenericAgent는 자체적으로 진화하는 에이전트 프레임워크입니다. 이 에이전트는 3.3K 라인 길이의 초기 코드(seed)만으로도 스킬 트리를 성장시키며, 전체 시스템 제어 능력을 갖추게 됩니다. 특히, 기존 방식 대비 토큰 소비를 6배 줄이는 효율성을 보여주어 강력한 성능과 경제성을 동시에 제공합니다.
sgl-project/sglang
SGLang은 대규모 언어 모델(LLM)과 다중 모달 모델을 효율적으로 서비스하기 위해 설계된 고성능 서빙 프레임워크입니다. 이 도구는 LLM 및 멀티모달 모델의 배포와 추론 과정을 최적화하여 높은 성능과 안정성을 제공합니다.
paperless-ngx/paperless-ngx
paperless-ngx는 강력한 커뮤니티 기반의 오픈 소스 문서 관리 시스템입니다. 이 시스템은 사용자가 스캔하거나 디지털로 받은 모든 종류의 문서를 자동으로 처리하고, 내용을 색인화하며 안전하게 보관할 수 있도록 돕습니다. 직관적인 인터페이스와 높은 확장성을 제공하여 개인 및 기업 환경 모두에서 효율적인 아카이빙 솔루션을 구축할 수 있습니다.
Google Magika, AI 기반 파일 타입 감지 도구
Google이 공개한 Magika는 AI 모델을 활용하여 파일의 내용을 분석하고 정확한 파일 형식(file content type)을 신속하게 감지하는 도구입니다. Python으로 작성되었으며, 최근 GitHub 트렌딩에서 급부상하며 개발자들이 다양한 파일의 실제 포맷을 빠르게 식별할 수 있도록 지원합니다.
nv-tlabs/lyra: 오픈소스 생성형 3D 월드 모델 프로젝트
NVIDIA TLAbs에서 공개한 'Lyra'는 오픈소스 기반의 생성형 3D 월드 모델을 제공합니다. Python으로 작성되었으며, 최근 일주일간 GitHub 트렌딩 순위가 급증했습니다. 이 프로젝트는 가상 세계를 생성하고 상호작용할 수 있는 모델 아키텍처를 구현하여, 게임 개발, 시뮬레이션, 로보틱스 등 다양한 분야에서 3D 콘텐츠 생성의 새로운 가능성을 열어줍니다.
RAG-Anything: 멀티모달 문서 처리를 위한 올인원 RAG 시스템
RAG-Anything은 텍스트, 이미지, 표, 수식 등 다양한 형태의 복합적인(multimodal) 문서를 처리할 수 있도록 설계된 통합형 검색 증강 생성 (RAG) 시스템입니다. 기존 RAG가 텍스트에만 집중했던 한계를 극복하고, VLM 기반 분석을 통해 시각적 및 구조적 정보를 깊이 있게 활용합니다. 이 시스템은 MinerU를 활용한 고정밀 문서 파싱부터 시작하여, 콘텐츠 유형별 전문 분석기(Visual Content Analyzer, Structured Data Interpreter 등)와 멀티모달 지식 그래프 구축까지 엔드
LLM 추론 속도 향상 기술: DFlash를 활용한 블록 확산 디코딩
DFlash는 Speculative Decoding을 위해 설계된 경량 블록 확산(Block Diffusion) 모델입니다. 이 기술은 LLM의 추론 속도를 획기적으로 높이면서도 높은 품질을 유지할 수 있게 합니다. vLLM, SGLang 등 주요 서빙 프레임워크를 지원하며, Qwen3.5-27B부터 LLaMA-3.1-8B까지 다양한 모델에 적용 가능합니다. 개발자는 이를 통해 병렬 드래프팅(parallel drafting)을 구현하여 대규모 언어 모델의 효율적인 추론 파이프라인을 구축할 수 있습니다.
다양한 파일 형식을 Markdown으로 변환하는 Python 유틸리티: MarkItDown
MarkItDown은 PDF, Word, Excel 등 다양한 형식의 파일을 LLM(대규모 언어 모델) 분석 파이프라인에 최적화된 Markdown 형식으로 변환하는 경량 Python 유틸리티입니다. GPT-4o와 같은 주류 LLMs가 Markdown을 네이티브하게 이해하고 사용한다는 점에 착안하여, 문서 구조(제목, 목록, 표 등)를 최대한 보존하면서 텍스트 분석에 적합한 형태로 데이터를 추출합니다. CLI 및 Python API를 모두 지원하며, OCR 기능이나 Azure Document Intelligence 연동 등 확장성이
AI SRE 에이전트 프레임워크: OpenSRE로 프로덕션 장애 대응 자동화
OpenSRE는 AI 기반 Site Reliability Engineering (SRE) 에이전트를 위한 오픈소스 프레임워크입니다. 기존의 로그, 메트릭, 트레이스 등 분산된 장애 증거를 통합하여 프로덕션 인시던트 대응을 자동화하는 것을 목표로 합니다. 이 프레임워크는 사용자의 자체 인프라에 배포되어 작동하며, 60개 이상의 도구와 서비스(Grafana, Datadog, AWS 등)에 연결됩니다. OpenSRE는 강화학습 (Reinforcement Learning) 환경을 구축하여 합성 장애 시뮬레이션 및 실제 엔드투엔드 (E2E)
다중 에이전트 워크플로우를 위한 OpenAI Agents SDK 가이드
OpenAI Agents SDK는 다중 에이전트(multi-agent) 워크플로우 구축을 위한 강력하고 경량화된 프레임워크입니다. 이 SDK는 OpenAI의 Chat Completions API뿐만 아니라 100개 이상의 다양한 LLM을 지원하는 공급자 독립적(provider-agnostic) 특성을 가집니다. 핵심 기능으로는 에이전트 정의, 도구 사용(Tools), 안전장치(Guardrails), 그리고 장기적인 작업을 위한 샌드박스 에이전트(Sandbox Agents)가 있습니다. 개발자는 이 SDK를 활용하여 복잡한 자동화 워
AI 에이전트 개발의 표준: APM으로 의존성 관리
APM은 AI 에이전트 전용 오픈소스 의존성 관리자입니다. 기존 패키지 매니저(npm, pip 등)가 소프트웨어 라이브러리를 관리하듯, APM은 AI 에이전트의 핵심 구성 요소(프롬프트, 스킬, 플러그인, 컨텍스트 등)를 중앙 집중식으로 정의하고 배포합니다. 개발자는 `apm.yml` 파일에 필요한 모든 종속성을 선언하기만 하면, 다른 환경에서도 완벽하게 재현 가능한 에이전트 설정을 몇 초 만에 구축할 수 있습니다. 이는 단순히 코드를 관리하는 것을 넘어, 에이전트의 컨텍스트와 보안까지 통제하여 기업 수준의 거버넌스(governan
NVIDIA Isaac GR00T N1.7 출시: 범용 휴머노이드 로봇 제어 모델
NVIDIA가 최신 버전인 GR00T N1.7을 공개했습니다. 이 모델은 언어, 이미지 등 멀티모달 입력을 받아 다양한 환경에서 휴머노이드 로봇의 조작 작업을 수행하는 범용 비전-언어-행동 (VLA) 모델입니다. N1.7은 새로운 VLM 백본(Cosmos-Reason2-2B / Qwen3-VL)을 채택하고, 2만 시간 분량의 EgoScale 인간 비디오 데이터로 사전 학습되어 일반화 능력과 언어 이해 능력이 크게 향상되었습니다. 사용자는 이 모델을 활용하여 로봇 시뮬레이션 및 실제 하드웨어에서 프로토타이핑 및 연구를 진행할 수 있으
금융 캔들스틱 특화 거대 언어 모델, Kronos 소개
Kronos는 금융 시장의 '언어'인 K-line 시퀀스를 위해 특별히 설계된 오픈소스 파운데이션 모델입니다. 45개 이상의 글로벌 거래소 데이터를 학습했으며, 일반적인 시계열 모델(TSFM)과 달리 금융 데이터 특유의 높은 노이즈와 복잡성을 처리할 수 있도록 설계되었습니다. Kronos는 두 단계 프레임워크를 사용합니다. 첫째, 전문 토크나이저가 연속적인 OHLCV 데이터를 계층적 이산 토큰으로 양자화(quantize)하고, 둘째, 대규모의 자기회귀 트랜스포머(autoregressive Transformer) 모델을 학습하여 다
자체 개선형 AI 에이전트, Hermes-Agent 소개
Hermes-Agent는 자체 학습 루프를 갖춘 혁신적인 AI 에이전트로, 사용 경험을 통해 스스로 기술(skill)을 생성하고 개선합니다. 이 에이전트는 세션 간 지식을 유지하기 위해 과거 대화를 검색하며 사용자 모델링을 심화합니다. $5 VPS 같은 저렴한 클라우드 환경에서 구동 가능하며, Telegram, Discord 등 다양한 플랫폼의 게이트웨이를 통해 접근할 수 있습니다. 사용자는 OpenAI, OpenRouter 등 원하는 LLM을 연결하여 사용할 수 있으며, 기존 에이전트 시스템(OpenClaw)에서도 쉽게 마이그레이
이 피드 구독하기
본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.