본문으로 건너뛰기

© 2026 Molayo

Reddit요약2026. 05. 25. 00:33

HRM 1B

요약

HRM 1B는 표준 베이스라인 대비 훨씬 적은 학습 토큰과 연산량을 사용하여 2~7B 규모의 모델과 경쟁하는 성능을 보여주는 베이스 모델입니다. 저자들은 학습 코드와 논문을 공개하였으며, 효율적인 사전 학습과 지시어 튜닝의 결합을 특징으로 합니다.

핵심 포인트

  • 표준 대비 100~900배 적은 학습 토큰 사용
  • 2~7B 파라미터 규모 모델과 경쟁 가능한 성능
  • 16대의 H100으로 약 46시간 만에 학습 가능
  • 사전 학습과 지시어 튜닝의 결합 구조

HRM 1B 베이스 모델 (Instruct 모델 아님).

저자들이 자신들의 Github(https://github.com/sapientinc/HRM-Text)에 학습 코드를 공개했으며, 논문(https://arxiv.org/pdf/2605.20613)에서 몇 가지 놀라운 주장을 하고 있습니다:

  • "표준 베이스라인(standard baselines)보다 약 100900배 적은 학습 토큰(training tokens)과 96432배 적은 추정 연산량(estimated compute)을 사용했음에도 불구하고, HRM-Text는 2~7B 파라미터 규모의 오픈 모델들과 경쟁할 만한 성능을 보여줍니다."

  • 1B 모델은 16대의 H100(2개 노드)을 사용하여 약 46시간 동안 약 $1472의 비용으로 학습할 수 있습니다.

빠르게 살펴보면, 학습은 사전 학습(pretraining)과 지시어 튜닝(instruction tuning)의 결합으로 보이며, 따라서 모델이 챗봇(chatbot)과 유사하게 작동하도록 프롬프트(prompt)를 줄 수 있습니다.

SFT(Supervised Fine-Tuning)와 RL(Reinforcement Learning, 강화학습)을 거친 후 모델이 어떻게 작동할지 보는 것이 매우 흥미로울 것이라고 생각합니다. 솔직히 말해서, 이 특정 아키텍처(architecture)의 한계가 무엇인지 잘 이해가 가지 않습니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 Reddit AI Engineering의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0