DeepSeek을 갖게 되어 다행이다

다른 회사들은 점차 오픈 가중치(open weight)에서 멀어지고 있으며, 베이스 모델(base model)을 출시하지 않고, 오픈 가중치 배포를 지연시키며, 최상위 모델을 출시하지 않고 있습니다(이 부분은 공정한 일이라고 생각하지만 여전히 그렇습니다). 또한 연구 논문 발표도 중단한 것으로 보입니다(Gemma 와 Qwen 과 같은 이전 모델들은 모델 학습 및 특성에 대한 상세한 논문을 공개했으나, 이제는 블로그 게시글과 모델 카드(model card)로 대체되었습니다).

Kimi(Kimi k2.5 에는 베이스 모델이 없음), GLM(GLM 5 와 5.1 에 베이스 모델이 없음), Minimax(M2.7 의 오픈 가중치 출시 지연 및 문제 있는 라이선스), Qwen(Qwen 3.5 397B 는 오픈 가중치였으나, 3.6 은 아님) 등의 사례가 있습니다.

반면 DeepSeek 은 매달 놀라운 연구 결과를 발표하고 있으며, 베이스 모델을 출시하고, 모델이 공식적으로 런칭되자마자 오픈 가중치를 공개하며, 런처 논문(launch paper)을 통해 모델 학습 및 아키텍처를 상세히 설명하고 있습니다.

그들은 해당 분야에서 매우 중요하며, 기술과 효율성을 앞서나가는 주체들입니다.

불행히도 작은 모델을 출시하지는 않지만, 모든 것을 가질 수는 없죠?

Insights

DeepSeek을 갖게 되어 다행이다

요약

핵심 포인트

댓글

Claude Code, Codex, Gemini를 포함한 12개의 AI 코딩 에이전트를 Visual Studio Code 내에서 팀으로서

UsbGpib V3, 새로운 오픈 소스 컨버터인 GPIBee로 하드웨어 설계 업데이트

Skillware 0.4.8 — 모든 에이전트를 위한 오프라인 프롬프트 인젝션 방화벽 (Offline Prompt Injection

누군가가 Coldcard 도둑에게 약 1달러의 비용으로 훔친 비트코인을 세탁해 주겠다는 온체인 제안을 보냈다고 알려짐

UsbGpib V3, 새로운 오픈 소스 컨버터인 GPIBee로 하드웨어 설계 업데이트

Skillware 0.4.8 — 모든 에이전트를 위한 오프라인 프롬프트 인젝션 방화벽 (Offline Prompt Injection

누군가가 Coldcard 도둑에게 약 1달러의 비용으로 훔친 비트코인을 세탁해 주겠다는 온체인 제안을 보냈다고 알려짐