본문으로 건너뛰기

© 2026 Molayo

Zenn헤드라인2026. 04. 27. 13:35

Keras Dense 레이어 활성화 함수: ReLU 대신 ELU 사용 시 CIFAR-10 정확도 향상

요약

MNIST 데이터셋에서는 ReLU, GELU, ELU의 성능 차이가 미미하지만, CIFAR-10과 같은 더 복잡한 이미지 분류 작업에서는 활성화 함수 선택이 중요함을 보여줍니다. Conv2D 레이어는 ReLU로 고정하고 Dense 레이어만 활성화 함수를 변경하는 간단한 실험을 통해, ELU가 ReLU 대비 테스트 정확도를 67.52%에서 68.94%로 높이는 결과를 확인했습니다.

핵심 포인트

  • MNIST 데이터셋에서는 ReLU, GELU, ELU의 성능 차이가 거의 없으나 CIFAR-10에서는 활성화 함수 선택이 정확도에 큰 영향을 미칩니다.
  • Conv2D 레이어는 ReLU를 고정하고 Dense 레이어만 활성화 함수 (ReLU/GELU/ELU) 를 변경하는 실험 설계가 효과적입니다.
  • CIFAR-10 데이터셋에서 Dense 레이어의 활성화 함수를 ReLU에서 ELU로 변경하면 테스트 정확도가 67.52%에서 68.94%로 상승합니다.

CNN 의 Dense 레이어를 ReLU 에서 ELU 로 바꾸면 정확도가 올라가는 이야기【Keras × CIFAR-10】

Keras 의 Dense 레이어의 활성화 함수는, 아무 생각 없이 relu 로 설정하고 있지 않으신가요? MNIST 데이터셋이라면 relu, gelu, elu 의 차이는 거의 제로입니다 (기존 비교 실험에서 확인됨). 그렇다면 CIFAR-10 이라면 어떨까요? 실험해 보았습니다.

실험 조건

  • 모델: Conv2D × 2 레이어 (relu 고정) + GAP + Dropout=0.2
  • 변수: Dense 레이어의 활성화 함수를 relu/gelu/elu 의 3 패턴으로만 변경
  • 데이터셋: CIFAR-10, 30 에포크

결과

activationTest Acc학습 시간
relu67.52%133.1 초
gelu68.94%133.1 초
elu68.94%133.1 초

결론

ReLU 를 사용하는 것이 항상 최선은 아닙니다. 특히 CIFAR-10 과 같이 더 복잡한 데이터셋에서는 GELU 나 ELU 로 활성화 함수를 변경하는 것이 ReLU 보다 높은 정확도를 얻을 수 있습니다. 실험을 통해 확인했습니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 Zenn ML의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
2

댓글

0