본문으로 건너뛰기

© 2026 Molayo

Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

GitHub AI Research 17필터 해제

GitHub요약

learn-to-race/l2r

자율 주행 레이싱을 위한 오픈 소스 강화학습 환경인 L2R을 소개합니다. ICCV 2021 논문으로 발표되었으며, 주요 AI 컨퍼런스의 공식 챌린지 트랙으로 채택된 검증된 연구 환경입니다.

2시간 전0
GitHub요약

LoRA를 이용한 LLM 미세 조정 (Fine-tuning)

LoRA(Low-Rank Adaptation) 기술을 활용하여 대규모 언어 모델을 효율적으로 미세 조정하는 방법을 다룹니다. SST-2 데이터셋을 사용하여 텍스트 분류 작업을 수행하는 Jupyter Notebook 기반의 튜토리얼입니다.

6일 전0
GitHub요약

NVIDIA PhysicsNeMo

NVIDIA PhysicsNeMo는 AI4Science를 위한 오픈 소스 SciML 프레임워크로, 물리 AI 모델의 구축부터 배포까지 지원합니다. v2.0 업데이트를 통해 설치와 외부 패키지 통합이 더욱 용이해졌으며, 물리 지식과 데이터를 결합한 실시간 예측 모델 개발에 최적화되어 있습니다.

6월 10일0
GitHub요약

roboflow/notebooks

Roboflow에서 제공하는 컴퓨터 비전 모델 및 기술 튜토리얼 모음입니다. 기초 아키텍처부터 YOLO11, SAM 3, Qwen3-VL 등 최신 SOTA 모델까지 다양한 구현 사례를 Jupyter Notebook 형태로 제공합니다.

6월 9일0
GitHub요약

zjunlp/KnowAgent

KnowAgent는 LLM 기반 에이전트의 계획 능력을 강화하기 위해 행동 지식 베이스를 활용하는 연구입니다. 행동 지식을 텍스트로 변환하여 모델이 궤적을 생성할 때 이를 활용하게 하며, 지식 기반 자기 학습을 통해 성능을 지속적으로 개선합니다.

5월 27일0
GitHub요약

The-FinAI/PIXIU

PIXIU는 금융 특화 거대 언어 모델(LLM), 지시어 튜닝 데이터, 그리고 금융 LLM을 종합적으로 평가할 수 있는 벤치마크를 제공하는 최초의 오픈 소스 리소스입니다. 금융 AI 분야의 오픈 소스 생태계 발전을 목표로 합니다.

5월 27일0
GitHub요약

AI 에이전트, LLM 프레임워크 및 코딩 도구를 위한 203개의 심층 튜토리얼

AI 에이전트, LLM 프레임워크 및 코딩 도구의 내부 작동 원리를 심층적으로 다루는 203개의 튜토리얼 모음입니다. 단순 사용법을 넘어 아키텍처, 코드 워크스루, 프로덕션급 패턴을 8단계 구조로 상세히 설명합니다.

5월 27일1
GitHub요약

ahammadmejbah/Awesome-Datasets-Hub

ahammadmejbah/Awesome-Datasets-Hub는 대규모 언어 모델(LLMs) 학습 및 평가를 위한 엄선된 데이터셋 컬렉션 저장소입니다. 의료 AI, NLP, 멀티모달 학습, 인스트럭션 튜닝, 추론, 코드 생성 등 다양한 분야의 데이터셋과 벤치마크를 포함하고 있습니다.

5월 19일1
GitHub요약

MMMU-Benchmark/MMMU

MMMU는 전문가 수준의 AGI 달성을 목표로 하는 대규모 다학제 멀티모달 이해 및 추론 벤치마크입니다. 이 저장소는 관련 논문의 평가를 위한 Python 기반의 코드를 제공합니다.

5월 19일0
GitHub요약

그래프 증강 기술을 활용한 독일 법률 텍스트 분석 및 RAG 시스템 구축

독일 법률 텍스트 분석을 위해 지식 그래프(Knowledge Graph)와 RAG 시스템을 결합한 프로젝트입니다. 법률 도메인의 특수성을 반영하기 위해 의미론적 텍스트 분할과 네트워크 이론을 활용하여 언어 모델의 응답 정확도와 문맥 이해도를 높이는 데 집중합니다.

5월 18일0
GitHub요약

Time-MoE/Time-MoE

Time-MoE는 Mixture-of-Experts (MoE) 아키텍처 기반의 디코더 전용 시계열 파운데이션 모델 제품군입니다. 이 모델은 자기회귀 방식으로 작동하며, 최대 4096의 컨텍스트 길이와 임의의 예측 지평을 가진 범용적인 시계열 예측이 가능합니다. 또한, Time-300B는 9개 이상의 도메인에 걸쳐 3천억 개 이상의 타임 포인트를 포함하는 대규모 오픈 액세스 시계열 데이터 컬렉션으로 제공됩니다.

5월 15일1
GitHub요약

drawbridge/keras-mmoe

본 저장소는 TensorFlow Keras를 활용하여 Multi-gate Mixture-of-Experts (MMoE) 모델을 구현한 코드입니다. UCI의 census-income 데이터셋을 사용한 실행 데모 예시가 제공되며, 코드는 문서화되어 있어 확장성이 높습니다. 이 프로젝트는 Emin Orhan의 연구를 기반으로 하며, 사용자들은 다양한 벤치마크 개선, 다른 프레임워크(PyTorch, MXNet)로 재작성, 또는 정확도 향상 등의 방식으로 기여할 수 있습니다.

5월 15일0
GitHub요약

mechramc/Orion

mechramc/Orion은 Apple Silicon(M 시리즈) 의 Apple Neural Engine(ANE) 을 직접 활용하여 작은 규모의 LLM 을 온디바이스에서 학습 및 추론할 수 있는 오픈소스 런타임입니다. CoreML 이나 Metal 과 같은 외부 프레임워크 없이 순수하게 ANE 하드웨어를 타겟팅한 프로젝트로, 오프라인 환경에서도 로컬 모델 개발이 가능합니다.

4월 25일6
GitHub요약

psmarter/mini-infer:从零构建的 LLM 推理引擎

GitHub 레포지토리 psmarter/mini-infer 는 PyTorch 기반의 완전한 LLM 추론 엔진입니다. 페이지드 KV 캐시, 컨티뉴어스 배치, 스펙ulative decoding, CUDA graph 등 최신 최적화 기법들을 모두 구현하여 오픈소스 커뮤니티에서 주목받고 있습니다.

4월 25일7
GitHub요약

alibaba/MNN

TL;DR 알리바바에서 검증된 초고속 경량 추론 엔진 MNN 이 공개되었습니다. C++ 기반의 이 엔진은 ARM, Vulkan, Winograd 알고리즘 등을 지원하여 모바일 및 임베디드 기기에서 고성능 딥러닝 모델(특히 LLM) 을 실행할 수 있습니다. 기존 TensorFlow Lite 나 ONNX Runtime 과 대안으로 주목받고 있으며, 리소스 제약이 있는 환경에서도 효율적인 추론을 가능하게 합니다.

4월 25일5
GitHub요약

대규모 LLM 추론 엔진 Aphrodite Engine 소개

Aphrodite Engine은 대규모 언어 모델(LLM) 추론을 위한 고성능 C++ 기반 오픈소스 엔진입니다. 이 프로젝트는 NVIDIA CUDA, AMD ROCm, Google TPU 등 다양한 하드웨어 가속기를 지원하며, Intel Inferentia와 같은 전용 칩셋도 포함합니다. LoRA(저랭크 어댑터) 및 추측적 디코딩(Speculative Decoding)과 같은 최신 최적화 기법을 내장하여 추론 속도를 극대화하고 있습니다.

4월 25일5
GitHub요약

Rust 기반 데이터 연동형 AI 엔진 SpiceAI 소개

SpiceAI 는 데이터 기반 AI 애플리케이션과 에이전트를 위한 가용성 높은 SQL 쿼리, 검색 및 LLM 추론 엔진입니다. Rust 로 작성되어 성능과 효율성을 극대화하며, 외부 데이터 소스를 실시간으로 인메모리 캐싱하여 지연 시간을 획기적으로 줄입니다. 복잡한 데이터 연동 없이도 LLM 에 최신 정보를 제공하여 '데이터 그라운디드 AI' 구축을 가능하게 합니다.

4월 25일6

이 피드 구독하기

본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.