Insights

AI가 자동으로 큐레이션·번역·정리하는 기술 동향 피드입니다.

X @Thom_Wolf (HuggingFace 공동창립자) 18건필터 해제

HF요약

유명한 Terminal-Bench의 과학 분야 확장 소식

Terminal-Bench가 코딩을 넘어 생명 과학, 물리, 수학 등 과학 분야로 확장됩니다. 이 벤치마크는 AI 에이전트가 실제 과학적 워크플로우에서 도구를 얼마나 효과적으로 제어하는지 평가합니다.

terminal-benchai-benchmarksai-agentsscience-ai

28분 전0

HF요약

약 2,500달러로 제작한 이족 보행 로봇

약 2,500달러의 저렴한 비용으로 제작된 3D 프린팅 기반의 이족 보행 로봇을 소개합니다. 하드웨어, 런타임, 학습 환경을 모두 갖춘 오픈 로봇 학습 플랫폼인 LeRobot Humanoid를 출시했습니다.

29분 전0

HF요약

오늘 Laguna M.1 과 Laguna XS.2 공개

본 기사는 두 가지 새로운 오픈-웨이트 기반 모델인 Laguna M.1과 Laguna XS.2를 발표합니다. 특히 Laguna XS.2는 Apache 2.0 라이선스 하에 제공되며, 이 모델들은 대규모 사전 학습(pre-training), 데이터 혼합 최적화, 합성 데이터 활용 등 다양한 고급 훈련 기법을 적용했습니다. 개발팀은 코딩 에이전트의 성능 향상을 위해 데이터 큐레이션부터 RL 런타임까지 전체 모델 훈련 스택을 자체적으로 구축하고 개선했음을 강조합니다.

4월 29일18

HF요약

'lerobot-rollout' 소개 — 어떤 훈련된 정책을든 어떤 실제 로봇에나 한 번의 CLI 명령으로 배포합니다.

lerobot-rollout은 훈련된 로봇 정책을 실제 물리적 로봇에 배포하는 과정을 혁신적으로 단순화한 도구입니다. 기존에는 정책 실행 및 추론 엔진 사용 시 여러 스크립트와 복잡한 설정이 필요했지만, 이 도구는 단일 CLI 명령으로 모든 것을 처리할 수 있게 합니다. 이를 통해 사용자들은 'Base' (단순 테스트), 'Sentry' (장시간 모니터링 및 데이터 스트리밍), 'Highlight' (사건 기반 녹화) 등 다양한 롤아웃 전략을 쉽게 구현하여 로봇의 실제 성능 검증과 데이터 수집 효율성을 극대화할 수 있습니다.

4월 29일2

HF요약

7B 모델이 671B 모델을 이겼다

본 기사는 공식 정리 증명 분야에서 작은 규모의 7B 모델이 훨씬 큰 671B 모델을 능가하는 성과를 보여준 사례를 다룹니다. 이러한 성능 향상의 핵심 원인은 단순히 데이터 양 증가가 아니라, 비대칭 자기 플레이(asymmetric self-play) 과정에서 발생하는 보상 해킹 루프 문제를 해결했기 때문입니다. 스탠포드 연구진이 RL 스케일링의 한계를 극복한 방법을 심층적으로 분석합니다.

4월 29일2

HF요약

깊이 있는 콘텐츠 포스트 경고** 일요일 아침을 위한 기술적 깊이 탐구, 짧은 탐정 이야기 와 RLHF 튜토리얼 사이 어딘가 우리는 최근 TRL 라이브러리에 AsyncGRPO를 추가하여 추론과 훈련을 분리하고 훨씬 더 빠르고 강력하게 확장할 수 …

이 기술 기사는 TRL(Transformer Reinforcement Learning) 라이브러리에 AsyncGRPO 기능을 추가하여 모델의 추론과 훈련 과정을 분리하고 성능 및 확장성을 크게 향상시킨 내용을 다룹니다. 이 업데이트를 통해 사용자는 더욱 빠르고 강력하게 대규모 언어 모델을 학습시키고 배포할 수 있게 됩니다.

4월 27일4

HF요약

가장 큰 로봇 프로젝트 중 하나를 오픈소스로 공개합니다

본 기사는 오픈아rms(open-arms)와의 협력을 통해 수집하고 주석 처리한 옷 접기 데이터를 기반으로, 양손(bimanual) 구성을 위한 최적의 로봇 모델을 훈련하는 방법을 탐구했음을 알립니다. 이 모든 과정과 결과물을 완전히 오픈소스로 공개하여 연구 커뮤니티에 기여하고자 합니다.

4월 27일1

HF요약

작고 저렴한 오픈 웨이트 모델이 Anthropic 의 취약점 분석을 재현

작고 저렴한 오픈 웨이트 언어 모델들을 사용하여 Anthropic이 강조했던 특정 취약점 분석을 재현한 결과, 대부분의 모델들이 일관되게 동일한 보안 취약점을 감지하는 것으로 나타났습니다. 특히 36억 개의 활성 파라미터를 가진 소형 모델도 플래그십 FreeBSD 악용 사례를 성공적으로 식별했으며, 51억 개 규모의 오픈 소스 모델은 오래된 OpenBSD 버그의 핵심 악용 연쇄를 복원하는 등 높은 성능을 보였습니다.

4월 27일2

HF요약

AI가 지배하는 소프트웨어 세계에서 구조의 변화. 몇 가지 1차 반성들 (TL;DR은 끝에): 소프트웨어 공급망 축소, 소프트웨어 모놀리스의 부활 – 코드를 다시 쓰고 대규모 외부 코드베이스를 이해하는 일이 저렴해지면, 깊은 의존성 트리에 의존하려는…

AI 기술이 발전함에 따라 소프트웨어 개발의 패러다임과 구조가 근본적으로 변화하고 있습니다. 특히 AI 도구들이 코드를 재작성하고 복잡한 외부 코드베이스를 이해하는 비용을 낮추면서, 기존의 깊은 의존성 트리에 기반했던 아키텍처 설계 방식이 약화되고 있습니다. 이러한 변화는 소프트웨어 공급망의 축소와 대규모 모놀리스(Monolith) 구조의 부활을 촉진할 수 있음을 시사합니다.

4월 27일3

HF요약

테렌스 tao 가 공동 창립한 @SAIRfoundation 과의 협업을 심화하는 데 매우 기대합니다.

본 글은 AI와 과학(화학, 물리학, 생물학 등) 분야의 협업을 강조하며, 테렌스 tao가 공동 창립한 SAIRfoundation과의 파트너십 심화를 기대하고 있음을 밝히고 있습니다. 이들은 데이터셋 공유, 챌린지 구축, 커뮤니티 형성 등을 통해 오픈 사이언스의 발전에 기여하고자 합니다.

4월 27일1

HF요약

개요 치트시트

이 기술 기사는 AI 모델의 심층 분석을 제공하며, 특히 TRL 라이브러리에 AsyncGRPO 기능을 추가한 내용을 다룹니다. 이 업데이트를 통해 추론(inference)과 학습(training) 과정을 분리하여 모델 개발 및 운영 효율성을 크게 높이고, 더 빠르고 강력하게 확장할 수 있게 되었습니다.

4월 27일1

HF요약

GPU 클러스터로 LLM 훈련하는 '초대규모 플레이북' 소개

Hugging Face 의 'The Ultra-Scale Playbook: Training LLMs on GPU Clusters'를 통해 데이터 병렬성, 전문가 병렬성, 텐서 병렬성, 파이프라인 병렬성 등 GPU 프로그래밍의 핵심 개념을 심층적으로 다룹니다. GTC 컨퍼런스에서 논의된 분산 LLM 추론 및 Junda Chen 의 강연을 참고하여 대규모 모델 훈련 아키텍처를 이해하세요.

4월 27일5

HF요약

테런스 tao 의 SAIR 재단, 수학 AI 오픈 협업 프로젝트 시작

수학계 권위자 테런스 Tao 가 이끄는 SAIR 재단이 'AI4Maths'를 위한 개방형·협업형 프로젝트를 추진 중입니다. 특히 수학적 지식 추출(디실레이션) 챌린지를 Hugging Face 생태계와 연계하여 공동 개발을 진행할 예정입니다. 이는 AI 를 활용한 수학 연구의 투명성과 접근성을 높이는 중요한 움직임으로 평가됩니다.

4월 26일3

HF중요요약

Hugging Face, Safetensors 포크 및 PyTorch Foundation 이양 발표

Hugging Face 는 모델 시리얼라이제이션 표준인 'Safetensors'를 Linux Foundation 이끄는 PyTorch Foundation 에 공식적으로 이양한다고 발표했다. 이는 Hugging Face 의 거버넌스 독립성을 확보하여, Safetensors 를 PyTorch 의 기본 시리얼라이제이션 포맷으로 채택하는 데 필요한 중립적 거버넌스를 마련하기 위한 조치다. 향후 torch 로딩 속도와 안전성 개선이 기대된다.

4월 26일3

HF중요요약

MatBench Discovery 순위 1 등극한 EquiformerV3, 계산 비용 1/3 수준

EquiformerV3 가 MatBench Discovery 벤치마크에서 최상위권을 차지하며 화학 물리 시뮬레이션 성능을 입증했습니다. 기존 경쟁 모델 대비 필요한 컴퓨팅 리소스를 3 분의 1 이하로 절감하면서도 SE(3)-equivariant graph attention transformers 를 활용해 정밀한 화학 물리 현상을 재현하는 데 성공했습니다. 이 혁신적인 모델은 Hugging Face 에서 즉시 다운로드 및 활용 가능합니다.

4월 26일2

HF요약

Hugging Face, 1 천만 개 데이터셋 이정표 달성

TL;DR: Hugging Face 팀이 1 천만 개의 데이터셋을 수집하는 중요한 이정표를 달성했습니다. 이는 다양한 목적과 목표에 맞춰 데이터를 쉽게 조정하고 발전시킬 수 있는 기반을 마련했다는 의미입니다.

4월 26일5

HF요약

HF 생태계가 SOTA ML 에이전트 실행에 완벽하다

Thom Wolf는 Hugging Face(Aksel 및 사후 훈련 팀)의 작업을 칭찬하며, HF 생태계(논문, 데이터셋, 모델이 CLI로 접근 가능하고 스킬/md 파일 포함)가 최첨단 ML 에이전트 실행에 최적화됨을 강조했습니다. 어떤 AI 모델이라도 최고 성능으로 훈련할 수 있는 에이전트들을 지원한다고 밝혔습니다.

4월 26일4

HF요약

최첨단 LLM이 기술 도면을 CAD로 변환하는 실험 결과

Gemini 3.1 Pro, Claude Opus 4.7, GPT-5.4 등 최첨단 언어 모델들이 기술 도면 세트를 받아 유효한 3D CAD 모델을 생성할 수 있는지 검증했다. 아직 완벽한 재현에는 미치지 못했으나, 텍스트 기반 명령으로 실제 엔지니어링 도면을 생성하는 '생명의 신호'가 확인되었다.

4월 26일4

이 피드 구독하기

RSSFeedly, Inoreader 등으로 구독

API/api/search?q=검색어

AIllms.txt로 AI 크롤링 가이드