Transformer에서 현대적 추론 모델까지, LLM 논문, 프레임워크 및 도구 큐레이션 목록
요약
Transformer부터 DeepSeek-R1에 이르기까지 LLM의 발전을 다루는 주요 논문, 프레임워크, 도구들을 정리한 큐레이션 목록입니다. 학습 프레임워크, 추론 도구, 평가 리소스 및 교육 자료를 포괄적으로 제공합니다.
핵심 포인트
- GPT-1부터 DeepSeek-R1까지 300개 이상의 주요 논문 포함
- Megatron-LM 등 학습 프레임워크 및 추론 도구 정보 제공
- 오픈 LLM 체크포인트 및 리더보드 등 평가 리소스 포함
- LLM 개발 학습을 위한 튜토리얼, 코스, 도서 큐레이션
Transformer에서 현대적 추론 모델 (reasoning models)까지, 해당 분야를 추적하는 LLM 논문, 프레임워크 및 도구의 큐레이션 목록입니다.
- GPT-1부터 DeepSeek-R1까지 300개 이상의 주요 논문 (milestone papers)
- Megatron-LM과 같은 학습 프레임워크 (training frameworks) 및 추론 도구 (inference tools)
- 오픈 LLM 체크포인트 (Open LLM checkpoints), 리더보드 (leaderboards) 및 평가 리소스 (evaluation resources)
- LLM 개발 학습을 위한 튜토리얼 (tutorials), 코스 (courses) 및 도서 (books)
AI 자동 생성 콘텐츠
본 콘텐츠는 X @githubprojects (자동 발견)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기