본문으로 건너뛰기

© 2026 Molayo

DeepMind중요헤드라인2026. 04. 24. 05:07

Google AI, 돌고래 소통 해독에 활용: DolphinGemma 모델 공개

요약

구글은 조지아 공대 및 와일드돌핀 프로젝트(WDP)와 협력하여 돌고래의 복잡한 소통 구조를 학습하고 새로운 소리 시퀀스를 생성하는 기초 AI 모델 'DolphinGemma'를 발표했습니다. 이 4억 개 매개변수(parameter) 규모의 모델은 WDP가 수십 년간 축적한 방대한 음향 데이터를 기반으로 하며, 돌고래의 자연적인 발성 패턴을 분석하여 숨겨진 구조와 잠재적 의미를 밝혀내는 데 사용됩니다. 또한, 구글은 'CHAT' 시스템을 통해 인간과 돌고래 간에 단순화된 상호작용 어휘를 구축하는 연구도 진행하고 있습니다.

핵심 포인트

  • DolphinGemma는 Google의 Gemma 기술을 기반으로 하며, WDP가 수십 년간 축적한 와일드 애틀랜틱 스팟티드 돌고래 음향 데이터를 학습하여 개발된 오디오-인/오디오-아웃 모델입니다.
  • 이 4억 개 매개변수(parameter) 규모의 AI는 Pixel 휴대폰에서 구동되도록 최적화되었으며, 돌고래 소리 패턴을 분석하고 다음 예상 소리를 예측하는 방식으로 작동합니다.
  • WDP는 이 모델을 현장 시즌에 배치하여, 인간의 막대한 노력이 필요했던 자연적인 음성 시퀀스 속 숨겨진 구조와 의미를 발견하는 데 활용할 계획입니다.
  • 별도의 'CHAT (Cetacean Hearing Augmentation Telemetry)' 시스템은 돌고래가 모방한 합성 휘파람을 감지하고, 이를 특정 사물(예: 해초)과 연결하여 인간-돌고래 간의 상호작용 어휘를 구축하는 것을 목표로 합니다.

구글이 와일드 돌핀 프로젝트(WDP)와 협력하여 개발한 'DolphinGemma'는 돌고래의 복잡하고 미스터리한 소통 방식을 해독하려는 야심 찬 과학적 시도를 보여줍니다. 수십 년간 연구되어 온 돌고래의 클릭음, 휘파람, 폭발성 펄스(burst pulses) 등의 패턴을 단순히 듣는 것을 넘어, 그 구조를 이해하고 현실적인 반응까지 생성하는 것이 목표입니다.

1. WDP의 방대한 데이터와 연구 배경:
WDP는 1985년부터 바하마 지역에서 와일드 애틀랜틱 스팟티드 돌고래(Stenella frontalis)를 대상으로 세계에서 가장 오래 지속된 수중 연구 프로젝트를 수행해 왔습니다. 이 비침습적 접근 방식 덕분에, 연구진은 세대에 걸친 개별 돌고래의 정체성, 생애사, 관찰 행동이 기록된 독보적이고 풍부한 데이터셋을 확보했습니다.

연구의 핵심은 돌고래들의 자연적인 사회적 상호작용과 소통 분석입니다. 연구진은 휘파람(signature whistles) 같은 개별 식별 신호부터 싸움 중 발생하는 폭발성 '스쿼크'(squawks), 구애나 상어 추격 시 사용되는 클릭 '버즈'(buzzes)까지, 특정 소리 유형을 행동적 맥락과 연결해 왔습니다. 이러한 장기적인 관찰 분석은 돌고래의 자연 음향 시퀀스 내에 잠재된 언어 구조와 규칙을 찾으려는 기반이 됩니다.

2. DolphinGemma 모델 소개 및 작동 원리:
이러한 방대한 데이터를 활용하기 위해 구글이 개발한 것이 바로 'DolphinGemma'입니다. 이 AI 모델은 Google의 최신 오디오 기술인 SoundStream 토크나이저(tokenizer)를 사용하여 돌고래 소리를 효율적으로 표현하고, 복잡한 시퀀스 처리에 적합하도록 설계되었습니다.

  • 기술적 특징: DolphinGemma는 약 4억 개 매개변수(parameter) 규모로 개발되어, WDP가 현장에서 사용하는 Pixel 휴대폰에 직접 구동되도록 최적화되었다는 장점이 있습니다. 이는 모델의 실용성과 접근성을 극대화합니다.
  • 기반 기술: 이 모델은 Gemini를 구동하는 것과 동일한 연구 및 기술을 기반으로 하는 경량의 오픈 모델인 Gemma에서 영감을 받았습니다.
  • 작동 방식: DolphinGemma는 오디오 입력(audio-in)을 받아, 돌고래 소리 시퀀스 내의 패턴과 구조를 식별하고, 궁극적으로 다음 발생할 가능성이 높은 소리를 예측하는 방식으로 작동합니다. 이는 인간 언어 모델이 문장 속 다음 단어나 토큰을 예측하는 방식과 유사합니다.

3. 현장 적용 및 미래 목표:
WDP는 DolphinGemma를 이번 현장 시즌에 배치하여, 이전에는 엄청난 인적 노력이 필요했던 돌고래 자연 소통 패턴의 숨겨진 구조와 의미를 밝혀내는 데 활용할 계획입니다. 궁극적으로 연구자들은 이 모델을 통해 발견한 패턴에 합성된 사물 지칭 소리(synthetic sounds)를 결합하여, 돌고래와의 상호작용적 의사소통을 위한 공유 어휘를 확립하는 것을 목표로 합니다.

한편, 구글은 'CHAT (Cetacean Hearing Augmentation Telemetry)' 시스템 개발도 병행하고 있습니다. 이 시스템은 복잡한 자연 언어 해독보다는 단순화된 상호작용 어휘 구축에 초점을 맞춥니다. CHAT는 돌고래가 모방하는 합성 휘파람을 정확히 포착하고, 이를 특정 사물(예: 스카프, 해초)과 연결하여 연구자에게 전달함으로써, 인간과 돌고래 간의 양방향 소통 가능성을 탐구합니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 Google DeepMind의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
2

댓글

0