유전 프로그래밍 (GP) 기반 심볼릭 회귀 (SR)를 위한 개체군 초기화 방법의 평가
요약
유전 프로그래밍(GP) 기반 심볼릭 회귀(SR)에서 초기 개체군 초기화 방법이 솔루션의 정확도와 복잡도에 미치는 영향을 분석한 연구입니다. NSGA-II를 활용해 다양한 초기화 방식을 비교한 결과, 초기화 방법이 최종 파레토 프런트에 미치는 영향은 미미함을 확인했습니다.
핵심 포인트
- GP 기반 심볼릭 회귀에서 초기화 방법의 영향력 분석
- 무작위 초기화와 ESR 기반 초기화 방법 간의 성능 비교
- 초기 이점은 단 몇 세대 만에 사라짐을 확인
- 개체군 내 다양성이 확보된다면 초기화 방식은 중요하지 않음
우리는 심볼릭 회귀 (Symbolic Regression, SR)를 위한 유전 프로그래밍 (Genetic Programming, GP)의 초기 개체군 (initial population) 최적화가 솔루션의 정확도와 복잡도에 미치는 영향을 분석합니다. 우리는 다목적 진화 알고리즘 (Multi-objective Evolutionary Algorithm)인 NSGA-II를 기반으로 하는 GP/SR 구현체를 사용하여, 세 가지 잘 확립된 무작위 초기화 (random initialization) 방법과 전수 심볼릭 회귀 (Exhaustive Symbolic Regression, ESR)를 통해 얻은 작은 최적화 솔루션들을 이용한 초기화 방법을 비교합니다. 우리는 다양한 복잡도를 가진 12개의 합성 문제와 하나의 실제 데이터셋에서 각 초기화 방법으로 발견된 최종 파레토 프런트 (Pareto fronts)를 비교합니다. 분석 결과, 초기화 방법들 사이에서 정확도나 모델 복잡도 측면의 유의미한 차이는 발견되지 않았습니다. ESR을 통한 초기화가 갖는 초기 이점은 단 몇 세대(generations) 만에 사라집니다. 우리의 연구 결과는 초기 개체군 내의 다양성(diversity)이 유사하다면, GP 기반 심볼릭 회귀 (SR)에서 초기화 방법이 최종 파레토 프런트에 미치는 영향은 무시할 수 있는 수준임을 보여줍니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기