본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 05. 07. 17:55

장르 적응 화음 생성을 위한 팝과 재즈 믹스 비율에 대한 경험적 연구

요약

본 논문은 화음 진행 생성이라는 비교적 덜 연구된 주제에 초점을 맞추어, 장르 적응(genre adaptation) 문제를 다룹니다. 특히 팝 음악으로 사전 학습된 Music Transformer 모델을 재즈 스타일로 미세 조정하는 과정을 경험적으로 탐구합니다. 이 연구는 새로운 도메인(재즈)을 습득하면서도 이전 도메인(팝)의 지식을 유지하기 위해 얼마나 많은 양의 원본 데이터가 필요한지, 즉 '잊어버림(catastrophic forgetting)' 문제를 다루고 있습니다.

핵심 포인트

  • 화음 진행 생성은 독립적인 연구 주제로 다뤄질 가치가 있으며, 기존 음악 시스템에서 간과되는 영역이다.
  • 장르 적응 모델링 시 '파국적 망각(catastrophic forgetting)' 문제를 해결하는 것이 핵심 과제이다.
  • 팝으로 사전 학습된 Music Transformer를 재즈 데이터셋에 미세 조정하여 장르 전이 능력을 검증했다.
  • 데이터 부족 문제(재즈 코퍼스가 팝보다 작음) 하에서도 효과적인 지식 유지 전략을 탐구한다.

화음 진행 생성은 실용적으로 중요하지만 상대적으로 덜 연구된 주제입니다. 대부분의 대규모 기호 음악 시스템은 멜로디, 멀티트랙 편곡, 또는 오디오 합성을 목표로 하며, 화음 전용 모델은 일반적으로 더 큰 파이프라인 내부의 조건부 구성 요소로 제한됩니다. 이 논문은 화음 생성을 독립적인 작업으로 다루며, 이러한 모델을 장르 간에 적응시킬 때마다 제기되는 질문을 다룹니다: 새로운 도메인을 습득하면서 이전 도메인을 잊지 않으려면 미세 조정 (fine-tuning) 과정에서 얼마나 많은 이전 도메인 데이터가 유지되어야 하는가? 저는 팝 사전 학습된 2500 만 파라미터의 Music Transformer(84.24% 의 held-out pop 테스트 세트에서 top-1 화음 정확도) 를 기반으로 재즈 미세 조정을 연구합니다. 이용 가능한 재즈 코퍼스는 팝 코퍼스보다 10 배 작으므로, 모든 미세 조정 실행은 1,513 개의 재즈 학습 시퀀스를 모두 사용합니다. 스윙 변수는 팝

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
1

댓글

0