Искусственный интеллект научился распознавать разговоры дельфинов

Фото: Unsplash

Учёные натренировали нейронную сеть вычленять дельфиньи тональные сигналы из записей звуков моря. В планах – расшифровка дельфиньего языка.

Один из наиболее эффективных современных методов исследований популяций морских млекопитающих – это пассивный акустический мониторинг. Он гораздо действеннее и проще, чем визуальный мониторинг – дельфинов не ищут по камерам, а устанавливают специальные подводные микрофоны (гидрофоны) в акваториях, которые записывают все происходящее, и сигналы морских млекопитающих в том числе. 

Чтобы оптимизировать трудоемкий процесс поиска сигналов дельфинов среди больших объемов аудиозаписей, учёные Института океанологии им. П.П. Ширшова РАН и МФТИ разработали нейросетевой алгоритм для обнаружения тональных сигналов китообразных в подводных звукозаписях. Результат работы опубликован в журнале Moscow University Physics Bulletin.

Акустические сигналы большинства видов зубатых китообразных можно разделить на две большие категории: эхолокационные щелчки и тональные сигналы или свисты. Тональные сигналы менее направлены и не столь быстро затухают при распространении в воде из-за более низких частот, но с другой стороны они гораздо более изменчивы, чем щелчки, и требуют более сложных алгоритмов для обнаружения и классификации. Поэтому свое первое исследование учёные посвятили обнаружению исключительно тональных сигналов.

«Институт океанологии собрал большую фонотеку подводных акустических записей, для обработки которых требуется новый универсальный метод автоматического обнаружения сигналов. С этой целью мы обучили нейросеть находить звуки черноморских дельфинов на подводных аудиозаписях», — рассказал о проекте Михаил Криницкий, старший научный сотрудник Института океанологии им. П.П. Ширшова РАН и заведующий лабораторией машинного обучения в науках о Земле МФТИ.

Призывать на помощь нейросети понадобилось потому, что звуки дельфинов на аудиозаписи появляются очень редко — раз в 3-4 дня, а иногда и в 10-20 дней. Поэтому учёным было важно найти надежный способ обнаружения сигналов дельфинов, чтобы не тратить несколько дней на прослушивание записей. Теперь для этого можно просто запустить автоматический алгоритм поиска. 

Гидрофоны обычно устанавливаются в не слишком удаленных местах, в активно используемых человеком акваториях. В итоге на записях часто присутствует шумовое загрязнение. С резким ростом популярности нейросетей для решения этих проблем все чаще используются сверточные нейронные сети – они оказались способны с высокой точностью обнаруживать сигналы дельфинов даже в зашумленных аудиозаписях. 

Всего база данных для обучения состояла из девяти аудио файлов. Записи содержали 3208 сигналов дельфинов, размеченных экспертами. Данные подвергались полосовой фильтрации в диапазоне частот 5–45 кГц, в котором обычно содержатся сигналы дельфинов рода афалин. 

Благодаря универсальности подхода, получившуюся модель с некоторой доработкой можно успешно использовать для обнаружения тональных сигналов других видов морских млекопитающих. Это уже подтвердили предварительные результаты ее применения для обработки архива записей беломорских белух. Но из-за разницы в вокализациях для каждого вида китообразных потребуется своя адаптация нейросети, то есть дополнительная настройка уже созданного алгоритма. 

Фото: Центр коммуникации МФТИ
Спектрограмма сигнала свиста дельфинов, образующего характерный контур с повышенной спектральной плотностью мощности (слева) и экспертная разметка этих контуров на фоне этой же спектрограммы (зеленые линии справа).

«В большинстве исследований сейчас нейросети применяют для анализа сигналов крупных морских млекопитающих, например, китов. Их сигналы выделить гораздо проще, и на самом деле для них даже не нужен ИИ. Они обычно громче и проблема зашумления записи стоит не так остро. Для исследований сигналов дельфинов нейросети также применялись ранее, но пока на уровне классических алгоритмов качество обнаружения было не таким высоким. Мы разработали более совершенный алгоритм и добились более высокого результата: 67% по сравнению с обычными 56-60% точности выделения звуков. Мы продолжаем эту работу, и сейчас, после публикации, мы достигли даже более высокого качества алгоритма», — подчеркнул Михаил Криницкий.

Учёные планируют с помощью разработанной программы пролить свет на историю популяций дельфинов и белух, живущих в Чёрном и Белом морях, в акваториях, где много лет велась аудиозапись их подводной жизни. Динамику изменения популяций китообразных, являющихся видами-индикаторами, можно использовать для оценки благополучия экологического состояния морских экосистем.

Исследователи не исключают, что после анализа богатой фонотеки записей Института океанологии, они примутся и за расшифровку вокальных сигналов морских млекопитающих как механизма их социального взаимодействия. Такая работа подобна расшифровке языка общения птиц или анализу малоресурсных человеческих языков. Но для начала необходимо выделить характерные паттерны сигналов, назначение которых мы пока знаем не до конца.