벡터 값 리프(vector-valued leafs)를 이용한 그래디언트 부스팅 (Gradient boosting)
요약
기존의 그래디언트 부스팅이 단일 변수 기반의 목적 함수를 사용하던 한계를 넘어, 벡터 입력 함수로 확장하는 연구를 소개합니다. 다중 클래스 분류 등 벡터에 작용하는 목적 함수를 효율적으로 처리할 수 있는 새로운 알고리즘을 제안합니다.
핵심 포인트
- 그래디언트 부스팅을 벡터 입력 함수로 확장하는 방법론 제안
- 다중 클래스 분류를 위한 다항 로지스틱 로그 가능도 적용 가능
- 히스토그램 기반 의사결정 트리와 결합하여 효율성 확보
- 기존 프레임워크의 단일 변수 업데이트 방식 한계 극복
의사결정 트리 앙상블 (decision tree ensembles) 형태의 그래디언트 부스팅 (Gradient boosting)은 단일 변수의 로그 가능도 (log-likelihoods)에 기반한 단순한 목적 함수 (objective functions)를 사용하여 다양한 문제에 성공적으로 적용되어 왔습니다. 이 개념은 벡터에 작용하는 목적 함수로 자연스럽게 확장될 수 있습니다. 예를 들어, 관측치가 각 클래스에 대한 점수를 갖는 다중 클래스 분류 (multi-class classification)를 위한 다항 로지스틱 로그 가능도 (multinomial logistic log-likelihood)가 이에 해당합니다. 하지만 대중적인 프레임워크들은 입력 벡터의 값을 한 번에 하나씩 업데이트하거나, 2차 도함수 (second derivative)에 대한 대각 상한 (diagonal upper bound)을 사용하는 방식으로 이러한 함수들에 접근합니다. 본 연구는 일반적인 그래디언트 부스팅 (gradient boosting) 프레임워크를 벡터 입력 함수로 확장하며, 히스토그램 기반 의사결정 트리 (histogram-based decision trees)와 함께 효율적으로 사용할 수 있는 간단한 알고리즘을 제안합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기