SIMD 활용을 통한 대수 연산 가속화
요약
본 기술 기사는 대수 연산 가속화를 위해 DigitsOnTurbo(DoT)라는 새로운 접근 방식을 제안합니다. DoT는 기존 알고리즘을 벡터화하는 대신, 독립적이고 데이터 병렬적인 연산을 중심으로 계산 구조를 재구성하여 SIMD의 이점을 극대화합니다. 그 결과, 덧셈 및 뺄셈에서 최대 1.85배, 곱셈에서 최대 2.3배의 속도 향상을 달성하며, 이는 과학 계산과 암호학 분야 전반에 걸쳐 상당한 성능 개선을 가져옵니다.
핵심 포인트
- 대수 연산은 전통적으로 SIMD 병렬성을 제한적으로 활용해 왔습니다.
- 제안된 DigitsOnTurbo(DoT)는 알고리즘 자체를 벡터화하는 대신, 데이터 병렬적인 연산으로 계산을 재구성합니다.
- DoT는 덧셈/뺄셈에서 최대 1.85배, 곱셈에서 최대 2.3배의 속도 향상을 보여줍니다.
- 최적화된 라이브러리 통합 시, 전체 과학 계산 처리량은 최대 19.3% 향상될 수 있습니다.
대수 연산은 과학적 계산과 암호학에 널리 사용되어 왔으나, 전통적인 알고리즘의 고유한 의존성으로 인해 현대 CPU 에서 단일 명령어 다중 데이터 (SIMD) 병렬성을 제한적으로 적용해 왔습니다. 우리는 표준 알고리즘을 벡터화하는 대신 독립적이고 데이터 병렬적인 연산들을 중심으로 계산을 재구성함으로써 SIMD 가 제공하는 이점을 활용하는 DigitsOnTurbo(DoT) 를 제안합니다. 기존 SIMD 구현 대비 DoT 는 덧셈과 뺄셈에서 최대 1.85 배, 곱셈에서는 최대 2.3 배의 속도 향상을 달성합니다. 최첨단 라이브러리에 통합될 경우 DoT 는 덧셈과 뺄셈에서 최대 4 배, 곱셈에서 최대 2 배의 속도 향상을 가져오며, 이는 과학적 계산의 전체 엔드투엔드 처리량에 최대 19.3 % 향상과 암호학 구현에서 최대 7.9 %의 지연 시간 감소 및 5.9 %의 처리량 개선을 연쇄적으로 달성합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AR의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기