TiRex-2: 다변량 데이터 및 스트리밍으로의 TiRex 확장

우리는 과거 및 미래 공변량(covariates)을 모두 포함하는 다변량 예측(multivariate forecasting)으로 단변량(univariate) TiRex를 일반화한 재귀적 xLSTM 기반 시계열 파운데이션 모델(time series foundation model)인 TiRex-2를 소개합니다. 실제 세계의 예측은 본질적으로 순차적입니다. 관측값은 지속적으로 도착하고, 변수들은 공동으로 진화하며, 공변량의 일부는 사전에 알려져 있습니다. 기존의 Transformer 기반 시계열 파운데이션 모델은 변수 간 의존성(cross-variate dependencies)을 포착하지만, 컨텍스트 길이(context length)에 따라 이차 복잡도(quadratic complexity)를 유발하며 새로운 관측값이 도착할 때마다 전체 이력(full-history)을 재계산해야 합니다. TiRex-2는 스트리밍 상황에서 패치당(per-patch) 일정한 비용으로 작동하는 메모리 중심의 재귀적 설계(memory-centric recurrent design)를 통해 이러한 한계를 해결합니다. 이 모델은 양방향 시간 믹서(bidirectional time mixer)와 비대칭 그룹 어텐션 변수 믹서(asymmetric grouped-attention variate mixer)를 결합하여, 타겟 변수에 대한 엄격한 인과성(causality)을 유지하면서 미래에 알려진 공변량을 통합할 수 있게 합니다. 우리가 알기로는, 이것이 이러한 속성들의 조합을 달성한 최초의 시계열 파운데이션 모델입니다. 확장 가능한 다변량 사전 학습(multivariate pretraining)을 지원하기 위해, 우리는 대규모 단변량 코퍼스(corpora)로부터 다양한 다변량 샘플을 즉석에서 구성하는 합성 결합 파이프라인(synthetic coupling pipeline)을 제안합니다. 실증적으로, TiRex-2는 GIFT-Eval 및 fev-bench에서 최첨단(state-of-the-art) 제로샷(zero-shot) 성능을 달성하며, 임의의 컨텍스트 길이로 스트리밍될 때 안정성을 유지하고, 패치당 일정한 추론 비용을 유지합니다. 이 모델은 단변량 모드에서 38.4M 개의 활성 파라미터(active parameters)를 사용하며, 다변량 예측을 위해 44.1M 개의 파라미터가 추가로 활성화됩니다.

Insights

TiRex-2: 다변량 데이터 및 스트리밍으로의 TiRex 확장

요약

핵심 포인트

댓글

런타임 Helios-를 통해 의도가 명시적으로 강제되는 Prehook Gated Execution Policy Layer: Akashic은 각

Show HN: Meow – 네 번째이자 마지막 JavaScript 런타임 및 툴체인

더 많은 재배 면적과 재고량, 제품 약세에도 불구하고 상승세를 보이는 대두

USDA 보고서 이후 옥수수 강세론자들의 영향력 확대, 곡물 재고 데이터가 낙관적 전망 뒷받침

런타임 Helios-를 통해 의도가 명시적으로 강제되는 Prehook Gated Execution Policy Layer: Akashic은 각

Show HN: Meow – 네 번째이자 마지막 JavaScript 런타임 및 툴체인

더 많은 재배 면적과 재고량, 제품 약세에도 불구하고 상승세를 보이는 대두

USDA 보고서 이후 옥수수 강세론자들의 영향력 확대, 곡물 재고 데이터가 낙관적 전망 뒷받침