본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 04. 28. 23:37

혼합 기수 초쌍곡선 회전 CORDIC 를 활용한 시그모이드 함수의 하드웨어 효율적인 FPGA 구현

요약

본 논문은 비선형 활성화 함수인 시그모이드(Sigmoid) 함수의 하드웨어 효율적인 FPGA 구현 방안을 제시합니다. 지수 계산이 필요한 시그모이드 함수를 쌍곡선 탄젠트(tanh) 함수와 수학적으로 연결하고, 이를 혼합 기수 초쌍곡선 회전 CORDIC (MR-HRC) 알고리즘으로 처리하여 하드웨어 오버헤드를 최소화했습니다. 제안된 아키텍처는 파이프라인화되어 Xilinx Virtex-7 FPGA에 구현되었으며, 낮은 리소스 사용량과 높은 정확도를 동시에 달성했음을 실험적으로 입증했습니다.

핵심 포인트

  • 시그모이드 함수를 하드웨어 효율적인 방식으로 구현하기 위해 tanh 함수와의 수학적 관계를 활용함.
  • 혼합 기수 초쌍곡선 회전 CORDIC (MR-HRC) 알고리즘을 도입하여 수렴 속도를 가속화하고 안정성을 확보함.
  • 기존의 복잡한 계산 단계를 파이프라인화하여 FPGA에 구현함으로써 높은 처리 효율성을 달성함.
  • 실제 Xilinx Virtex-7 FPGA에서 16비트 고정점 표현으로 구현되었으며, 낮은 리소스 사용량(논리 슬라이스 835개)과 우수한 정확도를 보임.

비선형 활성화 함수의 효율적인 하드웨어 구현은 리소스 제약이 있는 엣지 디바이스 (Field-Programmable Gate Arrays, FPGAs) 와 같은 환경에서 인공 신경망을 배포하는 데 있어 중요한 과제입니다. 지수 계산을 필요로 하는 시그모이드 활성화 함수는 확률적 출력, 이진 분류 및 순환 신경망의 게이트 메커니즘에 널리 사용되고 있습니다. 본 논문은 혼합 기수 CORDIC 기반 아키텍처를 사용하여 시그모이드 활성화 함수의 하드웨어 효율적인 FPGA 구현을 제시합니다. 제안된 방법은 시그모이드 함수와 쌍곡선 탄젠트 (hyperbolic tangent) 함수 간의 수학적 관계를 활용합니다. 입력 범위를 1로 정규화하여, 해당 tanh 계산을 0.5 의 축소된 범위 내에서 수행하게 함으로써 수렴 행동을 현저히 개선합니다. 최소한의 하드웨어 오버헤드로 높은 정확도를 달성하기 위해 기수 2 (radix-2) 와 기수 4 (radix-4) 반복을 결합한 수정된 혼합 기수 초쌍곡선 회전 CORDIC (MR-HRC) 알고리즘이 도입됩니다. 초기 기수 2 단계는 안정적인 수렴을 보장하고, 이후의 기수 4 단계는 스케일 팩터 보상을 요구하지 않으면서도 수렴 속도를 가속화합니다. 최종 단계에서는 MR-HRC 알고리즘에서 도출된 쌍곡선 사인 및 코사인 값을 나누어 쌍곡선 탄젠트를 계산하기 위해 기수 2 선형 벡터링 CORDIC (R2-LVC) 이 사용됩니다. 전체 아키텍처는 완전히 파이프라인화되어 FPGA 에 구현되었습니다. 이 설계는 16 비트 고정점 표현을 사용하여 Xilinx Virtex-7 FPGA 에서 실현되었습니다. 실험 결과는 하드웨어 활용도를 현저히 감소시켰으며, 논리 슬라이스 835 개와 DSP 사용量为 0 로 요구됨을 보여주었습니다. 또한, 평균 절대 오차 (mean absolute error) 가 4.23 × 10^-4 로 달성되어 여러 최근 시그모이드 구현보다 우수한 성능을 보였습니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.AR의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
3

댓글

0