arXiv논문2026. 05. 07. 17:55

장르 적응 화음 생성을 위한 팝과 재즈 믹스 비율에 대한 경험적 연구

요약

본 논문은 화음 진행 생성이라는 비교적 덜 연구된 주제에 초점을 맞추어, 장르 적응(genre adaptation) 문제를 다룹니다. 특히 팝 음악으로 사전 학습된 Music Transformer 모델을 재즈 스타일로 미세 조정하는 과정을 경험적으로 탐구합니다. 이 연구는 새로운 도메인(재즈)을 습득하면서도 이전 도메인(팝)의 지식을 유지하기 위해 얼마나 많은 양의 원본 데이터가 필요한지, 즉 '잊어버림(catastrophic forgetting)' 문제를 다루고 있습니다.

핵심 포인트

화음 진행 생성은 독립적인 연구 주제로 다뤄질 가치가 있으며, 기존 음악 시스템에서 간과되는 영역이다.
장르 적응 모델링 시 '파국적 망각(catastrophic forgetting)' 문제를 해결하는 것이 핵심 과제이다.
팝으로 사전 학습된 Music Transformer를 재즈 데이터셋에 미세 조정하여 장르 전이 능력을 검증했다.
데이터 부족 문제(재즈 코퍼스가 팝보다 작음) 하에서도 효과적인 지식 유지 전략을 탐구한다.

화음 진행 생성은 실용적으로 중요하지만 상대적으로 덜 연구된 주제입니다. 대부분의 대규모 기호 음악 시스템은 멜로디, 멀티트랙 편곡, 또는 오디오 합성을 목표로 하며, 화음 전용 모델은 일반적으로 더 큰 파이프라인 내부의 조건부 구성 요소로 제한됩니다. 이 논문은 화음 생성을 독립적인 작업으로 다루며, 이러한 모델을 장르 간에 적응시킬 때마다 제기되는 질문을 다룹니다: 새로운 도메인을 습득하면서 이전 도메인을 잊지 않으려면 미세 조정 (fine-tuning) 과정에서 얼마나 많은 이전 도메인 데이터가 유지되어야 하는가? 저는 팝 사전 학습된 2500 만 파라미터의 Music Transformer(84.24% 의 held-out pop 테스트 세트에서 top-1 화음 정확도) 를 기반으로 재즈 미세 조정을 연구합니다. 이용 가능한 재즈 코퍼스는 팝 코퍼스보다 10 배 작으므로, 모든 미세 조정 실행은 1,513 개의 재즈 학습 시퀀스를 모두 사용합니다. 스윙 변수는 팝

AI 자동 생성 콘텐츠

원문 바로가기

장르 적응 화음 생성을 위한 팝과 재즈 믹스 비율에 대한 경험적 연구

요약

핵심 포인트

댓글