Insights
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
X @clementdelangue (자동 발견) 59건필터 해제
사람들이 '디스틸레이션'이라고 부르는 것은 매우 일반적인 관행입니다
본문은 '디스틸레이션'이라는 용어가 실제로는 다른 모델을 사용하여 자사 모델을 벤치마크하거나, 입력을 평가하거나, 데이터셋에 정보를 추가하는 등 매우 일반적인 관행을 지칭한다고 설명합니다. 필자는 이러한 행위가 공개 데이터를 사용하는 것과 마찬가지로 공정한 이용(fair use)의 범위에 포함될 것이라고 주장하고 있습니다.
사람들이 '디스틸레이션'이라고 부르는 것은 매우 일반적인 관행입니다
본문은 '디스틸레이션'이라는 용어가 실제로는 다른 모델을 사용하여 자신의 모델을 벤치마크하거나, 입력을 평가하거나, 데이터셋에 추가하는 등 일반적인 연구 관행을 지칭한다고 설명합니다. 필자는 이러한 행위가 공정한 사용(fair use)의 범위에 포함되어야 한다고 주장하며, 이는 공개 데이터를 사용하는 것과 유사한 맥락으로 간주해야 한다고 강조합니다.
Musk, 증언대에 올라 xAI가 OpenAI 모델을 정제하여 xAI를 훈련시키고 있으며, OpenAI의 기술을 사용하여 xAI를 구축하고 있다고 인정하다
일론 머스크가 법정에서 자신의 회사인 xAI가 오픈AI의 모델을 디스틸링(distilling)하여 자체 모델을 훈련시키고 있으며, 오픈AI의 기술을 활용하여 xAI를 구축하고 있음을 인정했습니다. 이는 경쟁사였던 오픈AI의 핵심 기술과 지적 재산을 활용하여 새로운 AI 시스템을 개발하는 중요한 사례로 해석됩니다.
APEX-Agents 에 오픈소스 모델용 @huggingface 리더보드 출시
APEX-Agents가 오픈소스 모델을 평가하기 위한 새로운 Hugging Face 리더보드를 출시했습니다. 이 벤치마크는 AI 모델이 컨설턴트, 변호사, 은행가 등 전문 직업군의 실제 업무를 수행할 수 있는 능력을 측정하는 데 초점을 맞추고 있습니다.
Allen AI, Hugging Face 에서 OlmPool 연구 시리즈 출시
Allen AI가 Hugging Face 플랫폼을 통해 OlmPool 연구 시리즈를 공개했습니다. 이 연구는 150B 토큰으로 학습된 초기 7-8B 모델 체크포인트를 활용하여, 작은 규모의 아키텍처 선택이 긴 컨텍스트 확장(long context extension)에 미치는 영향을 심층적으로 탐구하는 것을 목표로 합니다.
지식 증류는 중국 실험실만의 것이 아님
지식 증류(Knowledge Distillation)는 특정 국가나 연구소만의 독점 기술이 아니며, 이미 산업 표준으로 자리 잡은 일반적인 기법입니다. 오픈AI나 안스로픽 같은 선두 기업들뿐만 아니라, 다수의 미국 기업들도 중국의 오픈소스 모델을 활용하여 지식 증류를 수행하고 있습니다.
어제 @xenovacom 가 Reachy Mini 를 조립했고, 오늘 아침 Claude 를 이용해 이 새로운 버전의 첫 번째 앱을 1 시간
xenovacom이 Reachy Mini를 조립한 후, 작성자는 Claude AI를 활용하여 이 새로운 로봇 버전의 첫 번째 애플리케이션을 단 1시간 만에 개발했습니다. 이는 에이전트 소프트웨어를 탑재하여 누구나 자신만의 에이전트를 구축할 수 있는 최초의 '에이전트 네이티브' 로봇으로 소개됩니다.
Hugging Face ML-Intern 업데이트 및 기능 소개
Hugging Face의 ML-Intern에 네이티브 메트릭 로깅 기능과 TrackioApp 통합이 추가되어, 사용자가 실행하는 모든 학습 런을 실시간으로 추적할 수 있게 되었습니다. 이 업데이트를 통해 사용자들은 작은 데이터셋과 모델을 사용하여 빠르고 효율적인 실험을 진행하고 결과를 모니터링할 수 있습니다.
Hy-MT1.5-1.8B-1.25bit 오픈소스 공개: 스마트폰에서 완전히 오프라인으로 실행되는 440MB 번역 모델, 33 개 언어 지원 및
Hy-MT1.5-1.8B-1.25bit라는 오픈소스 번역 모델이 공개되었습니다. 이 모델은 크기가 440MB에 불과하여 스마트폰에서도 완전히 오프라인으로 실행할 수 있으며, 33개 언어를 지원합니다. 또한, 18억 개의 파라미터임에도 불구하고 상용 번역 API나 235B 규모의 대형 모델과 동등한 수준의 뛰어난 성능을 보여줍니다.
로봇 공학에 @GoogleAIStudio Gemini Live API 를 사용할 수 있다는 사실을 아셨나요?
Google AI Studio의 Gemini Live API를 로봇 공학 분야에 활용할 수 있다는 정보를 제공합니다. 이 기술은 로봇 시스템에 인공지능 기능을 통합하여 새로운 가능성을 열어줄 것으로 기대됩니다.
Gemini Live 를 @pollenrobotics 의 Reachy Mini 데모에 추가했습니다
Google의 최신 AI 기능인 Gemini Live를 @pollenrobotics의 Reachy Mini 로봇 데모에 성공적으로 통합했습니다. 이 데모는 실시간 음성 및 비전 처리 능력을 갖춘 Gemini 3.1 Flash Live 기능을 활용하며, Google 검색을 통한 정보 지향(Grounding), 이동 동작을 위한 도구 사용, 그리고 Lyria 3를 이용한 음악 생성 등 다양한 첨단 AI 기술들을 결합하여 매우 흥미로운 시연을 선보입니다.
미iami 사무실을 위한 새로운 Reach Mini 로봇 도착!
새로운 Reach Mini 로봇이 미애미 사무실에 도착했습니다. 이 로봇은 에이전트 소프트웨어를 통해 일반 사용자에게 직접 서비스를 제공하는 최초의 로봇으로, 누구나 자신만의 에이전트를 활용하여 다양한 애플리케이션을 구축할 수 있는 것이 특징입니다. 개발 과정의 어려움에도 불구하고, 오픈소스 로봇 출하가 활발하게 이루어지고 있으며 앞으로도 지속적인 공급이 예상됩니다.
30 만 명의 AI 개발자가 이미 하드웨어를 Hugging Face 에 추가하여 로컬에서 실행 가능한 모델을 즉시 확인했습니다.
Hugging Face 플랫폼을 통해 사용자가 자신의 하드웨어 사양을 추가하고, 이를 공개적으로 프로필에 표시할 수 있게 되었습니다. 이 기능을 활용하면 AI 개발자들이 로컬 환경에서 모델을 실행하는 데 필요한 하드웨어 정보를 쉽게 공유하고 확인할 수 있습니다.
오늘부터 Laguna M.1 과 Laguna XS.2 를 출시합니다
회사에서 첫 공개 모델인 Laguna M.1과 Laguna XS.2를 출시하며, 이와 함께 에이전트 하네스 및 제품 미리보기 경험을 제공합니다. 두 모델 모두 데이터 파이프라인, 훈련 인프라, 그리고 에이전트 강화학습(RL)을 포함한 자체 스택에서 처음부터 훈련되었다는 점이 특징입니다.
Laguna XS.2 릴리스에 대한 축하
poolsideai가 Laguna XS.2 버전을 출시하며 축하받고 있습니다. 이 버전은 vllm_project에서 Day 0 지원을 제공하며, LLM Compressor를 통해 생성된 FP8, INT4, NVFP4 양자화 체크포인트를 포함합니다. 특히 33B 파라미터 중 3B가 활성화되었으며, 에이전트 코딩 및 장기 범위의 소프트웨어 작업에 최적화되어 있습니다.
실제 디버거를 활용한 Qwen3-Coder의 포스트 트레이닝 결과
본 기사는 실제 디버거 환경을 활용하여 Qwen3-Coder 모델을 포스트 트레이닝한 결과를 보고합니다. 이 과정을 통해 모델의 버그 해결 능력이 크게 향상되어, 문제 해결률이 70%에서 89%로 증가했으며 평균 수정 데일리가 46턴에서 19턴으로 대폭 감소했습니다. 특히, 단순히 코드를 분석하는 것을 넘어 실행 기반 추론, 라이브 변수 및 호출 스택 검사, 브레이크포인트 설정 등 실제 디버거의 기능을 활용할 수 있게 되었습니다.
ML-Intern 업데이트: 이제 내부 작동 원리를 실제로 확인할 수 있습니다
ML-Intern에 최신 업데이트가 적용되어 내부 작동 원리를 실시간으로 확인할 수 있게 되었습니다. 네이티브 메트릭 로깅과 Trackio 통합 기능이 추가됨으로써, 에이전트의 학습 실행 과정에서 발생하는 모든 과정을 라이브 곡선 형태로 관찰할 수 있습니다. 이로써 이전보다 훨씬 투명하고 이해하기 쉬운 방식으로 모델의 동작을 분석할 수 있게 되었습니다.
ml intern 에 네이티브 메트릭 로깅 및 @TrackioApp 통합 추가
ml intern에 네이티브 메트릭 로깅 기능과 @TrackioApp 통합을 추가하여, 사용자가 시작하는 모든 학습 런(training run)을 실시간으로 추적할 수 있게 되었습니다. 이 업데이트를 통해 ML 모델의 학습 과정을 보다 상세하고 효율적으로 모니터링할 수 있습니다.
핫 테이크: Git은 90%의 ML 데이터에 적합하지 않은 추상화였다.
이 글은 머신러닝(ML) 데이터의 대부분을 관리하는 데 Git 버전 관리 시스템이 부적절하다고 주장합니다. 체크포인트, 최적화 상태, 훈련 로그 등 ML 워크플로우에서 발생하는 많은 유형의 데이터는 버전 제어보다는 빠르고 저렴하며 변경 가능한 저장 공간을 필요로 합니다. 이에 따라 작성자들은 'Buckets'라는 새로운 형태의 스토리지를 구축하여 이 문제를 해결하고자 했습니다.
이 피드 구독하기
본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.