본문으로 건너뛰기

© 2026 Molayo

Reddit요약2026. 06. 21. 01:00

안녕하세요 Reddit 여러분, ML, LLM 및 수학적 직관을 가르치는 '나만의 LLM 만들기' 워크숍을 YouTube에 게시했습니다

요약

수학적 지식 없이도 LLM을 구축할 수 있도록 돕는 YouTube 워크숍을 소개합니다. 머신러닝 기초부터 트랜스포머 아키텍처, 사전/사후 학습까지 전 과정을 코드와 엑셀 예제로 다룹니다.

핵심 포인트

  • ML 기초부터 심층 신경망, 트랜스포머 아키텍처까지 포괄적 학습
  • 엑셀을 활용한 수학적 직관 형성 및 코드 실습 병행
  • GPU 코딩(PyTorch, CUDA, Triton) 및 최신 최적화 기법 포함
  • 사전 학습, 인스트럭션 튜닝, 강화학습(SimPO) 등 실무 프로세스 안내

인터넷 친구 여러분 안녕하세요, 수학이나 ML(Machine Learning) 사전 지식 없이도 나만의 LLM(Large Language Model)을 구축하는 방법에 관한 워크숍을 녹화했습니다. 이 워크숍은 머신러닝 (Machine Learning) 기초부터 심층 신경망 (Deep Neural Networks), 트랜스포머 아키텍처 (Transformer Architecture), 그리고 사전/사후 학습 (Pre/Post-training)까지 모든 내용을 다룹니다.
유일한 전제 조건은 코드와 엑셀 (Excel) 예제를 통해 배우는 것에 익숙해지는 것입니다.

대규모 언어 모델 (Large Language Models) 샘플링
대규모 언어 모델 (Large Language Model) 역공학 (Reverse Engineering)
퍼셉트론 (Perceptrons): wx+b
활성화 함수 (Activation Functions): ReLU, GELU, SwiGLU
GPU 코딩 (GPU Coding): PyTorch, torch.compile(), fused kernels, CUDA, Triton
MLP/FFN: 다중 입력 (Multi-input), 다층 퍼셉트론 (Multi-Layer Perceptrons), 피드포워드 네트워크 (Feed-Forward Networks)
손실 함수 (Loss Functions): 잔차 오차 (Residual errors), RMSE, 교차 엔트로피 (Cross Entropy), 손실 경관 (Loss Landscapes)
역전파 (Backpropagation): 학습 루프 (Training loops), 옵티마이저 (Optimizers), 학습률 (Learning Rate), 배치 크기 (Batch Size)
모델 저장 및 로드 (Saving & Loading Models)
초기화 (Initialization): Kaiming, Glorot
잔차 (Residuals): 덧셈 (Addition), 스케일링 (Scaling), 게이팅 (Gated), 연결 (Concatenation)
정규화 (Normalization): Pre-norm vs. Post-norm, RMSNorm, BatchNorm, LayerNorm
규제 (Regularization): 드롭아웃 (Dropout), 그래디언트 클리핑 (Gradient Clipping), 가중치 감쇠 (Weight Decay)
SoftMax
토크나이저 (Tokenizers): 문자 단위 (By Character), 단어 단위 (By Word), BPE, SentencePiece
임베딩 (Embeddings): 절대적 vs. 학습된 (Absolute vs. Learned), 사인파 vs. RoPE (Sinusoidal vs. RoPE)
어텐션 (Attention): MHA, GQA, MQA, MLA
트랜스포머 (Transformers)
사전 학습 (Pre-training): 데이터 소스 (Data Sources), 데이터셋 (Datasets), HTML 클리닝 (HTML Cleaning), 품질 필터링 (Quality Filtering), 샤딩 (Sharding)
평가 (Evaluation): 리더보드 (Leaderboards), 벤치마크 (Benchmarks), 검증기 vs. LLM-as-Judge (Verifiers vs. LLM-as-Judge)
인스트럭션 튜닝 (Instruction Tuning): Alpaca 및 기타 형식 (Alpaca & Other Formats), Self Instruct, 역량 (Capabilities)
강화학습 (Reinforcement Learning): 정책 최적화 (Policy Optimization), SimPO
다루지 않은 내용: 스케일링 (Scaling)

각 섹션에는 개념을 가르치는 슬라이드가 있으며, 이어서 수학적 직관을 기르기 위한 엑셀 수기 작업 (excel-by-hand)이 진행된 후 코딩 예제가 이어집니다. 목표는 현대적 LLM 개발의 모든 부분을 완전히 이해(grok)하는 것입니다.
우리는 지난달 샌프란시스코 (San Francisco)에서 이 워크숍을 대면으로 진행했으며, 온라인으로 시청하는 것이 모두에게 여유롭게 느껴지기를 바랍니다. 영상을 보는 것을 좋아하지 않는다면, 슬라이드와 연습 문제를 가져가서 스스로 학습 속도에 맞춰 진행할 수 있습니다.
/u/JustinAngel 제출 /r/MachineLearning
[link] [comments]

AI 자동 생성 콘텐츠

본 콘텐츠는 r/OpenAI Codex (search)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0