
【Gemini】 영상의 퀄리티를 폭발적으로 높이는 방법. YouTube용 BGM을 자동 생성하는 황금 프롬프트
요약
Gemini의 Thinking Mode와 멀티모달 기능을 활용하여 YouTube 영상에 최적화된 BGM을 생성하는 프롬프트 기법을 소개합니다. 루프 대응 및 주파수 대역 고려 등 기술적 요구사항을 구체화하여 고품질 음원을 얻는 절차를 다룹니다.
핵심 포인트
- Gemini의 Thinking Mode를 활용한 심층적 음악 구성 추론
- Seamless Loop 및 주파수 대역을 고려한 기술적 프롬프트 작성
- 목적과 장르를 구체화한 단계별 BGM 생성 프로세스
- 대화형 피드백을 통한 음악 질감 및 구성 미세 조정 방법
영상 제작에 있어 BGM은 시청자의 「이탈률」을 좌우하는 중요한 요소입니다.
무료 소재 사이트에서 "이미지에 맞는 곡을 좀처럼 찾을 수 없어..."라며 시간을 허비하기 쉽지만, 이는 「목적·장르·기술적 요구사항」을 구체적으로 언어화함으로써 해결할 수 있습니다.
본 기사에서는 Qiita에서 화제가 되고 있는 「디자인 × 코드」 지정법을 응용하여, 나레이션을 방해하지 않는 완벽한 배경음악을 생성하는 절차와 프롬프트를 공개합니다.
- 왜 당신의 BGM은 「이미지와 다른가"
- 실전: 풍부한 BGM을 생성하는 4단계
- 【음성 편】 자유로운 커스터마이징이 가능한 BGM 생성용 프롬프트 템플릿
- 수정하여 사용할 때의 「조정 팁"
- 실전 데모: 프롬프트를 입력하여 얻은 「놀라운 결과"
- 요약
AI가 만드는 음악이 영상과 맞지 않는 원인은 「기술적인 전제 조건」의 부족입니다.
프로는 단순한 장르뿐만 아니라 「Seamless Loop (루프 대응)」를 전제로 하며, 「목소리와 충돌하지 않는 주파수 대역」을 계산하여 발주합니다. 이 「구체적인 수치와 구성 요건」을 프롬프트에 포함하는 것이 소재 찾기에서 벗어나는 유일한 길입니다.
정밀도 높은 출력을 얻기 위해 다음 절차로 진행합니다.
먼저, Gemini의 모델 설정에서 「사고 모드 (Thinking Mode)」를 활성화합니다.
이를 통해 음악의 구성이나 전개를 깊게 추론한 후의 출력이 가능해집니다.
프롬프트를 입력하기 전에, 툴바에서 음성 생성 도구가 활성화되어 있는지 확인하십시오. 텍스트 생성뿐만 아니라 멀티모달 (Multimodal) 기능을 사용할 준비를 갖춥니다.
다음 템플릿을 베이스로 하여, 자신의 브랜드에 맞춰 고쳐 써서 입력합니다.
출력된 곡의 질감이나 전개를 확인하고, 필요에 따라 대화 형식으로 미세 조정합니다.
[ ]
부분을 고쳐 쓰는 것만으로 전용 BGM을 만들 수 있습니다.
You are an expert music producer and sound designer. Generate a 30-second high-quality background music (BGM) for a YouTube video based on the following requirements.
### 【기본 구성】
* 목적: YouTube 영상의 BGM ([여기에 상세 내용 입력: 예: 회사 소개 / 직원 인터뷰 배경음])
...
생성된 곡이 이미지와 조금 다를 경우에는 다음과 같은 말을 덧붙여 「재생성」 시켜보세요.
더 프로답고 딱딱한 인상을 주고 싶을 때
"조금 더 『Corporate (기업용)』 톤을 강화해 줘. 피아노 소리를 클리어하게 하고, 신뢰감 있는 울림으로 만들어 줘."
소리가 너무 커서 목소리가 잘 들리지 않을 때
"멜로디를 더 심플하게. 『Minimalist (미니멀리스트)』한 구성으로 해서, 주파수 대역이 사람의 목소리와 충돌하지 않도록 조정해 줘."
루프의 연결 부분을 더욱 매끄럽게 하고 싶을 때
"곡의 마지막 1초를, 첫 1초와 자연스럽게 이어지는 듯한 『Ambient (앰비언트/환경음적)한 여운』으로 끝내 줘."
이번에는 실제로,
"회사 소개 배경음"
을 테마로 Gemini에게 BGM 생성을 의뢰해 보겠습니다.
먼저, Gemini의 모델 설정에서 「사고 모드 (Thinking Mode)」를 활성화합니다.

【기본 구성】
목적: YouTube 영상의 BGM (회사 소개 배경음)
장르: 선진적인 Corporate Techno
...
영상의 분위기에 완벽하게 매치되는 30초 정도의 BGM이 생성되었습니다.
저는 조정 없이 확인 후 다운로드했지만, 여기서부터 요구사항이 있다면 조정도 가능합니다.

만약 가능하다면, 프롬프트를 입력할 때 「영상의 스크린샷」이나 「타겟 이미지」를 함께 업로드해 보세요.
Gemini는 시각 정보를 읽을 수 있으므로, "이 이미지의 이미지에 맞는 소리로 해줘"라거나 "이 영상의 편집 분위기에 맞춰줘"라고 지시하면 더욱 직관적으로 매치되는 BGM을 제안해 줍니다.
목적, 장르, 루프 요건을 「언어화」하여 전달하는 것만으로 AI는 일류 크리에이터로 변모합니다.
단, 음악 생성에는 막대한 토큰 (Token)이 소비되므로 무료 버전에는 한계가 있을 것이라 생각합니다.
필요에 따라 유료로 이용해 보시는 것은 어떨까요?
AI 자동 생성 콘텐츠
본 콘텐츠는 Qiita AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기