Об этом рассказал в беседе с RT старший преподаватель кафедры инструментального и прикладного программного обеспечения РТУ МИРЭА Андрей Рыбников.
«Модель не копирует запись, а синтезирует её заново, подбирая звуки по статистическим закономерностям. Она достаточно точно передаёт тембр и интонацию, но не воспроизводит все нюансы живой речи. Из-за этого появляются небольшие сбои: неестественные паузы, смещённые ударения и колебания интонации. Эти отклонения делают голос заметно отличающимся при внимательном прослушивании, особенно в голосовых сообщениях без изображения», — подчеркнул он.
Чтобы распознать такие сообщения, важно обращать внимание на акустические детали, посоветовал специалист.
«В искусственно сгенерированной речи тембр на отдельных словах может быть нестабильным, особенно длинных или редких, дыхание звучит ровно или почти отсутствует, а паузы часто воспринимаются как вставленные. Кроме того, содержание может отличаться от привычной манеры общения: появляются нетипичные формулировки, избыточные объяснения или упрощённая речь с просьбой срочно выполнить действие. Это происходит потому, что текст задаётся извне мошенниками, а синтезированный голос лишь воспроизводит его», — рассказал Рыбников.
Тем не менее технологии синтеза голоса быстро развиваются, поэтому такие записи звучат убедительно, особенно в ситуации спешки или эмоционального давления, предупредил собеседник RT.
«Человек просто не обращает внимания на нюансы, если сообщение приходит от знакомого контакта и содержит срочную просьбу, на что и рассчитывают злоумышленники. Если возникает сомнение в достоверности голосового сообщения, надо получить подтверждение информации через другой канал связи. Лучше всего самому позвонить или написать человеку в том мессенджере, в котором ранее уже велась переписка», — заключил специалист.
Ранее доцент Финансового университета при правительстве России Пётр Щербаченко перечислил в беседе с RT пять самых распространённых мошеннических схем за первый квартал 2026 года.