Insights
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
YouTube AI 채널 5건필터 해제
makemore 구축하기 Part 2: MLP
이 기술 기사는 Andrej Karpathy의 'makemore 구축하기 Part 2: MLP' 비디오를 기반으로 하며, 다층 퍼셉트론(MLP)을 사용하여 문자 단위 언어 모델을 구현하는 과정을 다룹니다. 이 과정에서 모델 학습, 학습률 최적화, 하이퍼파라미터 설정, 평가 지표 이해, 그리고 과소/과적합 방지 등 머신러닝의 핵심적인 기본 개념들을 심도 있게 소개합니다. 참가자들은 실제 데이터셋 구축부터 임베딩 레이어, 은닉층 및 출력층 구현에 이르기까지 전체 네트워크를 직접 코드로 작성하며 이론을 실습으로 연결하는 경험을 하게 됩니다.
나는 대형언어모델(LLM)을 어떻게 사용하는가
본 영상은 Andrej Karpathy가 대형 언어 모델(LLM)의 급변하는 생태계를 사례 중심으로 실용적으로 안내하는 가이드입니다. ChatGPT와 같은 주요 플랫폼을 활용하여 LLM이 일상생활과 전문 작업에 어떻게 통합되는지 다양한 기능을 보여줍니다. 인터넷 검색, 파일 업로드 및 문서 분석, Python 인터프리터 사용, 그리고 이미지/오디오/비디오 입력 및 출력 등 최신 멀티모달 기능들을 깊이 있게 다루며, 사용자들에게 LLM을 효과적으로 활용하는 방법을 제시합니다.
Let's build GPT: from scratch, in code, spelled out.
이 강의는 'Attention is All You Need' 논문과 OpenAI의 GPT-2/GPT-3 아키텍처를 기반으로 Generative Pretrained Transformer (GPT) 모델을 처음부터 코드로 구현하는 과정을 다룹니다. ChatGPT와 같은 최신 LLM의 작동 원리를 깊이 있게 이해할 수 있도록, 오토회귀 언어 모델링 프레임워크, 텐서 기초, PyTorch nn 사용법 등을 단계적으로 학습합니다. 강사는 학생들이 충분한 배경 지식을 갖추도록 이전 강의(makemore 등) 시청을 권장하며, 실습 환경과 관련 자료를 풍부하게 제공하고 있습니다.
[1 시간 강연] 대형 언어 모델 소개
본 강연은 ChatGPT, Claude 등 현재 사용되는 AI 시스템의 핵심 기술인 대형 언어 모델(LLM)에 대해 일반 대중을 대상으로 1시간 동안 소개하는 내용입니다. LLM이 무엇인지, 이 기술이 어디로 발전하고 있는지, 기존 운영체제와의 비교를 통해 새로운 컴퓨팅 패러다임으로서의 의미를 설명합니다. 또한, 이러한 급변하는 분야와 관련된 보안 과제에 대해서도 다루고 있습니다.
안드레이 카파티, 스팀펑크 뇌 AI 예술 선보여
안드레이 카파티가 Stable Diffusion을 이용해 '스팀펑크 뇌' 영상을 제작했습니다. 무작위 노이즈 벡터를 구면적으로 보간하며 8 시간 동안 A100 GPU로 렌더링한 결과입니다. AI 예술의 새로운 가능성과 기술적 접근법을 보여줍니다.
이 피드 구독하기
본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.