Insights
AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.
X @clementdelangue (자동 발견) 27건필터 해제
로컬 LLM 실행에 대한 열정
작성자는 현재 로컬 LLM(대규모 언어 모델) 실행 기술에 큰 관심을 보이며, 엔지니어와 협력하여 완전히 온디바이스(on-device)로 작동하는 제품들을 개발하고 있다. 최근 출시된 새로운 모델의 도입이 기존 제품의 품질을 즉각적으로 향상시키는 등, AI 분야가 매우 빠르게 발전하고 있음을 체감하며 흥미를 느끼고 있다.
현재 HF 에서 인기 있는 훌륭한 오픈 모델들
본 기사는 Hugging Face(HF)에서 현재 인기를 얻고 있는 몇 가지 우수한 오픈 소스 AI 모델들을 소개하고 있습니다. 주요 언급된 모델 제공자로는 DeepSeek AI, Xiaomi, OpenAI, MistralAI, 그리고 aipoolside 등이 있으며, 특히 NVIDIA AI의 Nemotron 3 Nano Omni와 같은 최신 모델들도 주목할 만하다고 강조합니다.
나노와일 소개! 에이전트만으로 전량 사전 학습된 초소형 DeepSeek 모델
나노와일(nanowhale)은 에이전트의 도움을 받아 전량 사전 학습된 초소형 DeepSeek 모델입니다. 이 모델은 @karpathy의 nanochat에서 영감을 받았으며, ml-intern이라는 가상의 에이전트를 활용하여 DeepSeek v4의 모든 아키텍처 발전을 적용한 1억 개 파라미터 규모의 MoE(Mixture of Experts)를 성공적으로 학습시켰습니다. 이는 AI 모델 개발 과정에 자율적인 에이전트 시스템을 도입하는 새로운 접근 방식을 보여줍니다.
모델 제공자 전환은 쉽지만, Harness 전환은 그렇지 않다
이 글은 AI 모델의 공급업체(model providers)를 변경하는 것과, 그 모델을 통합하고 관리하는 플랫폼인 'Harness'를 전환하는 것 사이의 어려움을 지적합니다. 모델 제공자 자체는 교체가 용이하지만, 특정 플랫폼에 종속된 Harness 환경을 벗어나기 어렵다는 점을 강조하며, 오픈 소스 기반의 독립적인 Harness가 필요함을 주장합니다.
타임지가 선정한 세계 최고 영향력 있는 AI 기업 상위 10 곳에 프랑스 기업이 두 개 포함됨
타임지(Time Magazine)가 선정한 세계 최고 영향력 있는 AI 기업 상위 10개 목록에 프랑스의 두 기업인 Mistral AI와 Hugging Face가 포함되었습니다. 이는 프랑스가 글로벌 인공지능 산업에서 중요한 입지를 구축하고 있음을 보여주는 사례입니다.
지난 주: 백악관이 중국 AI 실험실을 소위 '디스틸레이션 공격'으로 비난
백악관이 중국 AI 실험실의 '디스틸레이션 공격' 의혹을 제기한 데 이어, 이번 주에는 일론 머스크가 법정 증언에서 xAI가 오픈AI(OpenAI) 모델을 디스틸레이션하여 자체 모델을 훈련했음을 인정했습니다. 이는 대형 언어 모델(LLM)의 지적 재산권 및 경쟁 구도에 대한 논란이 심화되고 있음을 보여줍니다.
LIVE TRIAL UPDATE: OpenAI 의 변호사가 머스크에게 xAI 가 과거에 OpenAI 의 기술을 '디실팅(distill)'한
OpenAI 측 변호사가 일론 머스크에게 xAI가 과거 OpenAI의 기술을 '디실링(distill)'했는지 여부를 질문했습니다. 이에 대해 머스크는 AI 기업들이 일반적으로 다른 기업의 기술을 디실링하는 경향이 있다고 인정하며, 사비트의 추가 질문에 '일부'라고 답하여 사실상 그러한 행위가 있었음을 시사했습니다.
AgentTrove: 170만 개의 샘플을 가진 새로운 에이전트 데이터셋
AgentTrove는 약 170만 개의 샘플을 포함하는 새로운 대규모 에이전트(agentic) 데이터셋입니다. 이 데이터셋은 AI 에이전트의 개발 및 연구에 필요한 방대한 양의 실질적인 데이터를 제공합니다. OpenThoughts와 같은 도구 덕분에 이러한 고품질의 에이전트 관련 데이터 구축이 가능해졌음을 시사합니다.
사람들이 '디스틸레이션'이라고 부르는 것은 매우 일반적인 관행입니다
본문은 '디스틸레이션'이라는 용어가 실제로는 다른 모델을 사용하여 자사 모델을 벤치마크하거나, 입력을 평가하거나, 데이터셋에 정보를 추가하는 등 매우 일반적인 관행을 지칭한다고 설명합니다. 필자는 이러한 행위가 공개 데이터를 사용하는 것과 마찬가지로 공정한 이용(fair use)의 범위에 포함될 것이라고 주장하고 있습니다.
사람들이 '디스틸레이션'이라고 부르는 것은 매우 일반적인 관행입니다
본문은 '디스틸레이션'이라는 용어가 실제로는 다른 모델을 사용하여 자신의 모델을 벤치마크하거나, 입력을 평가하거나, 데이터셋에 추가하는 등 일반적인 연구 관행을 지칭한다고 설명합니다. 필자는 이러한 행위가 공정한 사용(fair use)의 범위에 포함되어야 한다고 주장하며, 이는 공개 데이터를 사용하는 것과 유사한 맥락으로 간주해야 한다고 강조합니다.
무스크가 법정에서 xAI 가 오픈AI 모델을 디스틸링하여 xAI 를 훈련시키고 있으며, 오픈AI 의 기술을 사용하여 xAI 를 구축하고 있다는
일론 머스크가 법정에서 자신의 회사인 xAI가 오픈AI의 모델을 디스틸링(distilling)하여 자체 모델을 훈련시키고 있으며, 오픈AI의 기술을 활용하여 xAI를 구축하고 있음을 인정했습니다. 이는 경쟁사였던 오픈AI의 핵심 기술과 지적 재산을 활용하여 새로운 AI 시스템을 개발하는 중요한 사례로 해석됩니다.
APEX-Agents 에 오픈소스 모델용 @huggingface 리더보드 출시
APEX-Agents가 오픈소스 모델을 평가하기 위한 새로운 Hugging Face 리더보드를 출시했습니다. 이 벤치마크는 AI 모델이 컨설턴트, 변호사, 은행가 등 전문 직업군의 실제 업무를 수행할 수 있는 능력을 측정하는 데 초점을 맞추고 있습니다.
Allen AI, Hugging Face 에서 OlmPool 연구 시리즈 출시
Allen AI가 Hugging Face 플랫폼을 통해 OlmPool 연구 시리즈를 공개했습니다. 이 연구는 150B 토큰으로 학습된 초기 7-8B 모델 체크포인트를 활용하여, 작은 규모의 아키텍처 선택이 긴 컨텍스트 확장(long context extension)에 미치는 영향을 심층적으로 탐구하는 것을 목표로 합니다.
지식 증류는 중국 실험실만의 것이 아님
지식 증류(Knowledge Distillation)는 특정 국가나 연구소만의 독점 기술이 아니며, 이미 산업 표준으로 자리 잡은 일반적인 기법입니다. 오픈AI나 안스로픽 같은 선두 기업들뿐만 아니라, 다수의 미국 기업들도 중국의 오픈소스 모델을 활용하여 지식 증류를 수행하고 있습니다.
어제 @xenovacom 가 Reachy Mini 를 조립했고, 오늘 아침 Claude 를 이용해 이 새로운 버전의 첫 번째 앱을 1 시간
xenovacom이 Reachy Mini를 조립한 후, 작성자는 Claude AI를 활용하여 이 새로운 로봇 버전의 첫 번째 애플리케이션을 단 1시간 만에 개발했습니다. 이는 에이전트 소프트웨어를 탑재하여 누구나 자신만의 에이전트를 구축할 수 있는 최초의 '에이전트 네이티브' 로봇으로 소개됩니다.
Hugging Face ML-Intern 업데이트 및 기능 소개
Hugging Face의 ML-Intern에 네이티브 메트릭 로깅 기능과 TrackioApp 통합이 추가되어, 사용자가 실행하는 모든 학습 런을 실시간으로 추적할 수 있게 되었습니다. 이 업데이트를 통해 사용자들은 작은 데이터셋과 모델을 사용하여 빠르고 효율적인 실험을 진행하고 결과를 모니터링할 수 있습니다.
Hy-MT1.5-1.8B-1.25bit 오픈소스 공개: 스마트폰에서 완전히 오프라인으로 실행되는 440MB 번역 모델, 33 개 언어 지원 및
Hy-MT1.5-1.8B-1.25bit라는 오픈소스 번역 모델이 공개되었습니다. 이 모델은 크기가 440MB에 불과하여 스마트폰에서도 완전히 오프라인으로 실행할 수 있으며, 33개 언어를 지원합니다. 또한, 18억 개의 파라미터임에도 불구하고 상용 번역 API나 235B 규모의 대형 모델과 동등한 수준의 뛰어난 성능을 보여줍니다.
로봇 공학에 @GoogleAIStudio Gemini Live API 를 사용할 수 있다는 사실을 아셨나요?
Google AI Studio의 Gemini Live API를 로봇 공학 분야에 활용할 수 있다는 정보를 제공합니다. 이 기술은 로봇 시스템에 인공지능 기능을 통합하여 새로운 가능성을 열어줄 것으로 기대됩니다.
Gemini Live 를 @pollenrobotics 의 Reachy Mini 데모에 추가했습니다
Google의 최신 AI 기능인 Gemini Live를 @pollenrobotics의 Reachy Mini 로봇 데모에 성공적으로 통합했습니다. 이 데모는 실시간 음성 및 비전 처리 능력을 갖춘 Gemini 3.1 Flash Live 기능을 활용하며, Google 검색을 통한 정보 지향(Grounding), 이동 동작을 위한 도구 사용, 그리고 Lyria 3를 이용한 음악 생성 등 다양한 첨단 AI 기술들을 결합하여 매우 흥미로운 시연을 선보입니다.
미iami 사무실을 위한 새로운 Reach Mini 로봇 도착!
새로운 Reach Mini 로봇이 미애미 사무실에 도착했습니다. 이 로봇은 에이전트 소프트웨어를 통해 일반 사용자에게 직접 서비스를 제공하는 최초의 로봇으로, 누구나 자신만의 에이전트를 활용하여 다양한 애플리케이션을 구축할 수 있는 것이 특징입니다. 개발 과정의 어려움에도 불구하고, 오픈소스 로봇 출하가 활발하게 이루어지고 있으며 앞으로도 지속적인 공급이 예상됩니다.
이 피드 구독하기
본 페이지의 콘텐츠는 AI가 공개된 소스를 기반으로 자동 수집·요약·번역한 것입니다. 원 저작권은 각 원저작자에게 있으며, 각 게시물의 “원문 바로가기” 링크를 통해 원문을 확인할 수 있습니다. 저작권자의 삭제 요청이 있을 경우 신속히 조치합니다.