«Для генерации звуков любого животного»: российские специалисты научили нейросеть говорить на языке кашалотов

Учёные из СПбГЭТУ «ЛЭТИ» научили нейросеть синтезировать «речь» кашалотов — воспроизводить звуки, аналогичные тем, которые издают эти морские млекопитающие. Разработка поможет биологам лучше разобраться в том, как именно общаются между собой киты. Об этом RT сообщили в пресс-службе университета. Результаты научного исследования опубликованы в журнале Big Data and Cognitive Computing.

Реальные записи голосов китов авторы работы преобразовали в спектрограммы — фотографические изображения спектра волн. А затем разделили их на фрагменты, подобные отдельным звукам человеческой речи. Из этих «кирпичиков» компьютерная программа уже формирует новые наборы сигналов в ультразвуковом диапазоне. Причём ИИ способен имитировать индивидуальные речевые особенности отдельных животных.

«Результатом стала нейросеть, которая может работать с высокочастотными сигналами и выдавать очень похожие щелчки определённого кашалота — с 10—12%-ным отклонением от метрик. В перспективе данный метод можно использовать для генерации звуков любого животного, например птиц. Для этого необходимо будет настроить алгоритм на обработку их голосовых данных», — пояснила RT доцент кафедры систем автоматизированного проектирования (САПР), старший научный сотрудник Молодёжного научно-исследовательского института (МолНИИ) СПбГЭТУ «ЛЭТИ» Екатерина Копец.

Как известно, некоторые животные, включая китов, используют звуки не только для общения с себе подобными, но и для ориентирования в пространстве. Кашалоты издают особые сигналы в ультразвуковом диапазоне, а затем по скорости отражённой звуковой волны определяют расположение препятствий. Эту способность у животных обнаружили в своё время создатели подводных аппаратов — сегодня эхолокаторы применяются для навигации подлодок и других морских судов.

Gettyimages.ru