drawbridge/keras-mmoe
요약
본 저장소는 TensorFlow Keras를 활용하여 Multi-gate Mixture-of-Experts (MMoE) 모델을 구현한 코드입니다. UCI의 census-income 데이터셋을 사용한 실행 데모 예시가 제공되며, 코드는 문서화되어 있어 확장성이 높습니다. 이 프로젝트는 Emin Orhan의 연구를 기반으로 하며, 사용자들은 다양한 벤치마크 개선, 다른 프레임워크(PyTorch, MXNet)로 재작성, 또는 정확도 향상 등의 방식으로 기여할 수 있습니다.
핵심 포인트
- TensorFlow Keras 기반의 Multi-gate Mixture-of-Experts (MMoE) 모델 구현 제공
- UCI census-income 데이터셋을 사용한 실행 데모 예시 포함
- 코드는 문서화되어 있으며, PyTorch나 MXNet 등 다른 프레임워크로 재작성 및 개선 가능
- 사용자 기여를 환영하며, 다양한 벤치마크 개선이나 정확도 향상에 초점을 맞출 수 있음
이 저장소는 TensorFlow Keras를 사용한 Multi-gate Mixture-of-Experts (MMoE) 모델의 구현을 포함하고 있습니다.
저자들이 설명하는 논문에 대한 영상 설명은 여기에서 확인하실 수 있습니다.
저장소 구성 요소:
-
Keras를 사용한 TensorFlow 기반의 Python 3.6 모델 구현
-
해당 코드는 Python 2.7과도 호환됩니다.
-
UCI의 census-income 데이터셋을 사용한 모델 실행 데모 예시
-
이 데이터셋은 논문의 섹션 6.3에 사용된 것과 동일합니다.
코드는 문서화되어 있으며 비교적 쉽게 확장할 수 있도록 설계되었습니다. 만약 이 코드를 귀하의 작업에 사용할 계획이라면, 이 저장소(아래에 BibTeX 포함)와 논문을 인용하는 것을 고려해 주세요.
-
Python 3.6
-
requirements.txt에 나열된 TensorFlow 및 Scikit-learn과 같은 기타 라이브러리 -
저장소 클론 (Clone)
-
의존성 설치
pip install -r requirements.txt
- 예제 코드 실행
python census_income_demo.py
- 논문의 모호함과 시간 및 리소스 제약으로 인해, 안타깝게도 논문에 나온 정확한 결과를 재현할 수는 없습니다.
이 저장소에 대한 기여를 환영합니다. 기여할 수 있는 예시는 다음과 같습니다:
- 모델을 TensorFlow, PyTorch 또는 MXNet으로 다시 작성하여 성능 향상
- census income 벤치마크를 논문의 것과 최대한 유사하게 개선
- 합성 벤치마크 (synthetic benchmark)를 논문의 것과 최대한 유사하게 개선
- 다른 공개 데이터셋을 사용하여 다양한 벤치마크에 대한 학습 수행
- 정확도 향상
- 시각화 (Visualizations)
저장소를 인용하려면 다음 BibTeX를 사용하세요:
@misc{keras_mmoe_2018,
title={Multi-gate Mixture-of-Experts model in Keras and TensorFlow},
author={Deng, Alvin},
...
이 코드는 Emin Orhan의 연구를 바탕으로 구축되었습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 GitHub AI Research의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기