Snowflake의 Arctic 모델: 기업 특화 AI에 대한 베팅

요약

Snowflake가 기업용 워크로드에 최적화된 오픈 소스 LLM인 Arctic을 출시했습니다. Dense-MoE 아키텍처를 통해 4,800억 개의 파라미터를 보유하면서도 추론 시에는 170억 개만 활성화하여 효율성을 극대화했습니다.

핵심 포인트

Dense-MoE 하이브리드 아키텍처로 대규모 지식과 추론 효율성 동시 확보
SQL, 코드 생성, STEM 데이터 중심의 기업 특화 학습 커리큘럼 적용
Spider, HumanEval+ 등 개발자 도구 관련 벤치마크에서 우수한 성능
Apache 2.0 라이선스로 상업적 이용 및 커스터마이징 자유도 제공

이번 주에는 Snowflake에서 출시한 Arctic이라는 이름의 새로운 대규모 언어 모델 (LLM)에 주목할 필요가 있습니다. 이 모델은 기업용 워크로드 (Enterprise workloads)에 초점을 맞춘 오픈 소스 (Open-source) 모델로, 독특한 아키텍처를 사용하여 SQL 및 코드 생성과 같은 특정 작업에서 높은 성능을 제공하는 동시에 인상적인 효율성을 유지합니다. 이는 단순히 또 다른 범용 모델이 아닙니다. 이 모델의 설계 선택은 AI 기반 도구를 구축하는 개발자들에게 직접적인 영향을 미칩니다.

색다른 방식의 MoE

Arctic의 핵심은 Dense-Mixture-of-Experts (MoE) 하이브리드 트랜스포머 (Transformer) 아키텍처를 채택하고 있다는 점입니다. MoE 모델이 새로운 것은 아니지만, Arctic의 구현 방식은 독특합니다. 이 모델은 10B(100억 개) 규모의 밀집형 트랜스포머 (Dense transformer) 모델과 다수의 '전문가 (Experts)'를 결합하여 총 4,800억 개의 파라미터 (Parameters)를 생성합니다.

하지만 추론 (Inference) 과정에서는 top-2 게이팅 (Gating) 메커니즘을 사용하여 해당 파라미터 중 170억 개만을 활성화합니다. 이러한 설계는 매우 큰 모델의 방대한 지식 용량과 훨씬 작은 모델의 추론 효율성이라는 두 마리 토끼를 모두 잡는 것을 목표로 합니다. 이 아키텍처는 128개의 특화된 전문가 (Specialized experts)를 활용하여, 다른 모델에 비해 활성화되는 파라미터 수는 적으면서도 높은 성능을 낼 수 있게 합니다. 이는 AI를 대규모로 배포할 때 핵심적인 요소인 상당한 비용 및 리소스 절감으로 이어집니다.

기업용 작업에 최적화된 설계

대부분의 오픈 소스 LLM은 광범위한 일반 작업을 위해 설계되었습니다. Arctic은 설계 단계부터 기업 지향적인 요구 사항에 구체적으로 초점을 맞추어 차별화됩니다. 학습 커리큘럼 (Training curriculum)은 의도적으로 세 단계로 구성되었으며, 마지막 두 단계는 코드, SQL 및 STEM 데이터를 사용하여 기업 중심의 기술을 강력하게 강조하도록 구조화되었습니다.

이러한 집중은 성능으로 보상받습니다. Arctic은 개발자 도구(developer tooling)에 중요한 벤치마크에서 강력한 결과를 보여줍니다. SQL 생성 (Spider), 코드 생성 (HumanEval+ 및 MBPP+), 그리고 지시 이행 (IFEval)에서 우수한 성능을 발휘합니다. 데이터베이스나 코드를 위한 AI 코파일럿 (AI co-pilots)을 구축하는 팀에게 이러한 특화된 능력은 더 일반화된 모델들에 대한 매력적인 대안이 됩니다. 이 모델은 SQL 쿼리 및 다양한 유형의 코드를 생성하기 위한 워크호스 (workhorse)로 명시적으로 설계되었습니다.

Arctic 시작하기

Snowflake는 Apache 2.0 라이선스로 Arctic을 출시하여, 상업적 이용을 위한 모델 가중치 (model weights)와 코드에 대한 제한 없는 접근을 제공합니다. 이러한 개방적인 접근 방식은 투명성과 커스터마이징 능력이 필요한 빌더들에게 큰 장점입니다.

다양한 인기 프레임워크를 사용하여 모델을 실행할 수 있습니다. 예를 들어, transformers 라이브러리를 사용하는 것은 매우 간단합니다. 지시 미세 조정 (instruct-tuned) 버전은 Hugging Face에서 직접 사용할 수 있습니다.

from transformers import pipeline

# 고수준 헬퍼로서 파이프라인(pipeline) 사용
...

자체 호스팅 (self-hosting) 외에도, Arctic은 NVIDIA NIM과 같은 서비스를 통해 사용할 수 있으며 Amazon SageMaker JumpStart에서 배포할 수 있어 더 많은 관리형 배포 옵션을 제공합니다.

요약

Snowflake Arctic은 특정 문제 세트를 위한 실용적인 모델입니다. 독특한 MoE (Mixture-of-Experts) 아키텍처는 효율성을 제공하며, 학습은 코드 및 SQL 생성이라는 고부가가치 기업 업무에 정밀하게 집중되어 있습니다. 이 도메인에서 AI 제품을 구축하는 엔지니어들에게 개방형 라이선스, 강력한 도메인 특화 성능, 그리고 아키텍처 효율성의 결합은 Arctic을 이번 주에 반드시 평가해 보아야 할 모델로 만듭니다.

출처

AI 자동 생성 콘텐츠

원문 바로가기

Snowflake의 Arctic 모델: 기업 특화 AI에 대한 베팅

요약

핵심 포인트

색다른 방식의 MoE

기업용 작업에 최적화된 설계

Arctic 시작하기

요약

출처

출처

댓글