본문으로 건너뛰기

© 2026 Molayo

X요약2026. 04. 25. 02:31

터키어 추론 모델 Kızagan-E4B 오픈소스 공개

요약

새로운 터키어 특화 LLM, Kızagan-E4B가 오픈소스로 공개되었습니다. 이 모델은 Google DeepMind의 Gemma 4 E4B-it base를 기반으로 하며, 개발자가 직접 구축한 54만 줄 규모의 다축(multi-axis) 터키어 SFT 데이터셋(~20억 토큰)을 활용하여 성능을 끌어올렸습니다. 터키어 NLP 분야 연구자나 해당 언어를 사용하는 애플리케이션 개발자에게 매우 유용한 리소스가 될 것입니다.

핵심 포인트

  • 새로운 오픈 소스 모델 'Kızagan-E4B'가 터키어 추론(inference)에 특화되어 공개되었습니다.
  • 기반 모델은 Google DeepMind의 Gemma 4 E4B-it base를 활용하여 안정성을 확보했습니다.
  • 모델 학습에는 개발자가 직접 구성한 54만 줄 규모의 다축 터키어 SFT 데이터셋(~20억 토큰)이 사용되었습니다.

안녕하세요 친구 여러분, 제가 오픈 소스로 공유한 새로운 터키어 추론 모델 Kızagan-E4B가 출시되었습니다!

Kızagan-E4B를 Google DeepMind가 2주 전에 출시한 Gemma 4 E4B-it base 모델을 기반으로, 제가 taxonomy와 domain 분포를 구성한 54만 줄(~20억 토큰) 다축 터키어 SFT 데이터셋으로

AI 자동 생성 콘텐츠

본 콘텐츠는 X @alicankiraz0 (자동 발견)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
5

댓글

0