niklassheth의 Pull Request #22596: talkie-1930-13b 지원 추가 · ggml-org/llama.cpp
요약
llama.cpp 프로젝트에 13B 규모의 빈티지 언어 모델인 talkie-1930-13b-it 지원이 추가되었습니다. 이 모델은 1931년 이전의 텍스트로 학습되어 과거의 언어 스타일을 시뮬레이션하도록 설계되었습니다.
핵심 포인트
- 1931년 이전 영어 텍스트 260B 토큰 기반 학습
- 지시어 미세 조정 및 온라인 DPO를 통한 성능 향상
- 역사적 텍스트를 활용한 빈티지 언어 모델 시뮬레이션
- llama.cpp를 통한 talkie-1930-13b-it 모델 지원
talkie-1930-13b-it
talkie-1930-13b-it는 13B 규모의 빈티지 언어 모델 (vintage language model)입니다. 이 모델은 1931년 이전의 영어 텍스트 260B 토큰으로 학습된 talkie-1930-13b-base를 지시어 미세 조정 (instruction-tuned post-train)한 모델입니다.
talkie-1930-13b-it는 에티켓 매뉴얼, 백과사전, 편지 쓰기 매뉴얼을 포함하여 1931년 이전의 참고 문헌에서 추출한 새로운 지시어-응답 쌍 (instruction-response pairs) 데이터셋을 사용하여 미세 조정 (finetuned)되었습니다. 그 후, 지시어 이행 능력 (instruction-following ability)을 향상시키기 위해 강화학습 (reinforcement learning, LLM-as-a-judge를 활용한 온라인 DPO) 과정을 거쳤습니다.
talkie에 대한 더 자세한 내용은 저희 보고서에서 확인하실 수 있습니다.
talkie를 실행하기 위한 참조 코드는 GitHub에서 확인 가능합니다.
과거의 누군가와 대화하는 것을 공상해 본 적이 있나요? 현대 세계에 대한 지식이 없는 사람에게 무엇을 물어보고 싶으신가요? 그들은 당신에게 무엇을 물어볼까요? 아직 타임머신은 없지만, Owain Evans의 표현을 빌리자면, 역사적 텍스트로만 학습된 언어 모델인 '빈티지' 언어 모델 (vintage language models)을 학습시킴으로써 이러한 경험을 시뮬레이션할 수 있습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 Reddit AI Engineering의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기