본문으로 건너뛰기

© 2026 Molayo

GitHub요약2026. 05. 15. 19:43

drawbridge/keras-mmoe

요약

본 저장소는 TensorFlow Keras를 활용하여 Multi-gate Mixture-of-Experts (MMoE) 모델을 구현한 코드입니다. UCI의 census-income 데이터셋을 사용한 실행 데모 예시가 제공되며, 코드는 문서화되어 있어 확장성이 높습니다. 이 프로젝트는 Emin Orhan의 연구를 기반으로 하며, 사용자들은 다양한 벤치마크 개선, 다른 프레임워크(PyTorch, MXNet)로 재작성, 또는 정확도 향상 등의 방식으로 기여할 수 있습니다.

핵심 포인트

  • TensorFlow Keras 기반의 Multi-gate Mixture-of-Experts (MMoE) 모델 구현 제공
  • UCI census-income 데이터셋을 사용한 실행 데모 예시 포함
  • 코드는 문서화되어 있으며, PyTorch나 MXNet 등 다른 프레임워크로 재작성 및 개선 가능
  • 사용자 기여를 환영하며, 다양한 벤치마크 개선이나 정확도 향상에 초점을 맞출 수 있음

이 저장소는 TensorFlow Keras를 사용한 Multi-gate Mixture-of-Experts (MMoE) 모델의 구현을 포함하고 있습니다.

저자들이 설명하는 논문에 대한 영상 설명은 여기에서 확인하실 수 있습니다.

저장소 구성 요소:

  • Keras를 사용한 TensorFlow 기반의 Python 3.6 모델 구현

  • 해당 코드는 Python 2.7과도 호환됩니다.

  • UCI의 census-income 데이터셋을 사용한 모델 실행 데모 예시

  • 이 데이터셋은 논문의 섹션 6.3에 사용된 것과 동일합니다.

코드는 문서화되어 있으며 비교적 쉽게 확장할 수 있도록 설계되었습니다. 만약 이 코드를 귀하의 작업에 사용할 계획이라면, 이 저장소(아래에 BibTeX 포함)와 논문을 인용하는 것을 고려해 주세요.

  • Python 3.6

  • requirements.txt에 나열된 TensorFlow 및 Scikit-learn과 같은 기타 라이브러리

  • 저장소 클론 (Clone)

  • 의존성 설치

pip install -r requirements.txt
  • 예제 코드 실행
python census_income_demo.py
  • 논문의 모호함과 시간 및 리소스 제약으로 인해, 안타깝게도 논문에 나온 정확한 결과를 재현할 수는 없습니다.

이 저장소에 대한 기여를 환영합니다. 기여할 수 있는 예시는 다음과 같습니다:

  • 모델을 TensorFlow, PyTorch 또는 MXNet으로 다시 작성하여 성능 향상
  • census income 벤치마크를 논문의 것과 최대한 유사하게 개선
  • 합성 벤치마크 (synthetic benchmark)를 논문의 것과 최대한 유사하게 개선
  • 다른 공개 데이터셋을 사용하여 다양한 벤치마크에 대한 학습 수행
  • 정확도 향상
  • 시각화 (Visualizations)

저장소를 인용하려면 다음 BibTeX를 사용하세요:

@misc{keras_mmoe_2018,
title={Multi-gate Mixture-of-Experts model in Keras and TensorFlow},
author={Deng, Alvin},
...

이 코드는 Emin Orhan의 연구를 바탕으로 구축되었습니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 GitHub AI Research의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0