Вы берёте трубку — и слышите голос своего сына. Или лучшей подруги. Или директора. Голос как настоящий: та же интонация, те же характерные паузы, тот же акцент. Человек просит срочно помочь деньгами или передать важные данные. Вы помогаете — и только потом узнаёте, что настоящий сын был в это время в другом городе и вам не звонил. Добро пожаловать в эпоху голосовых дипфейков. По данным ФБР, в 2024 году убытки от атак с использованием синтетических голосов и дипфейков в США превысили 25 млн долларов только по задокументированным случаям — и цифра продолжает расти.


Как работает клонирование голоса

Объяснить это несложно, даже если вы далеки от технологий.

Представьте, что у вас есть запись чьего-то голоса — несколько минут речи. Специальная программа «прослушивает» эту запись тысячи раз, запоминает всё: высоту голоса, темп, тембр, характерные звуки при дыхании, манеру произносить отдельные слова. Затем — это самое важное — программа может говорить этим голосом всё, что угодно. Вы пишете текст, а на выходе получаете аудиофайл, в котором конкретный человек «произносит» этот текст.

Именно это делают инструменты вроде ElevenLabs, RVC (Retrieval-based Voice Conversion) и десятки аналогов. Раньше такие технологии были доступны только крупным студиям. Сегодня это бесплатные или дешёвые сервисы, доступные любому человеку с интернетом.

Сколько нужно голоса? Для первых инструментов требовались часы записи. Современные системы справляются с 30–60 секундами. То есть один короткий видеоролик в соцсети, голосовое сообщение в мессенджере, интервью на YouTube — этого достаточно.


Откуда мошенники берут образцы голоса

Вот здесь начинается самое неприятное. Большинство из нас уже «сдали» свой голос — просто не задумываясь об этом.

Социальные сети. Видео в Instagram Reels, TikTok, ВКонтакте — это готовый аудиоматериал. Даже видео с фоновой музыкой: современные алгоритмы умеют вычленять голос из шума.

YouTube и подкасты. Если вы ведёте канал, записываете видеоуроки, выступаете на конференциях — у мошенников есть часы вашего голоса.

Голосовые сообщения в мессенджерах. Если ваш телефон или аккаунт в мессенджере когда-либо был взломан, а в нём хранятся голосовые — они могут попасть к злоумышленникам.

Телефонные разговоры. Некоторые схемы предполагают предварительный «нейтральный» звонок, во время которого с вас записывают голос. «Здравствуйте, это социологическое исследование, ответьте на несколько вопросов» — несколько минут записи уже получено.

Корпоративные утечки. Голосовые записи совещаний, вебинаров, внутренних звонков — всё это потенциальный материал.

⚠️ Важно: Если ваш ребёнок, родитель или другой близкий человек активно ведёт соцсети или YouTube-канал — его голос доступен для клонирования. Это не повод запрещать контент, но повод заранее договориться о кодовом слове.


Как выглядит атака на практике

Сценарий 1: Звонок от «сына»

Пожилые родители получают звонок. Голос — точь-в-точь их сына — говорит, что попал в беду: авария, задержание, больница. Просит срочно перевести деньги. Дальше разговор переходит к «следователю» или «сотруднику банка» — уже в стандартной схеме. Но первый голос — настоящая наживка, которая снимает всякий скептицизм.

Сценарий 2: «Руководитель» на работе

Сотруднику звонит человек с голосом директора и просит срочно перевести деньги поставщику или поделиться важными данными. «Я сейчас на переговорах, всё срочно, сделай прямо сейчас и не говори пока финансовому отделу». Эта схема в международной практике называется CEO fraud («мошенничество с руководителем») — по данным ФБР, только за 2024 год компании потеряли на ней сотни миллионов долларов.

Сценарий 3: Голосовое сообщение в мессенджере

Вам приходит голосовое сообщение от знакомого с просьбой срочно помочь деньгами. Голос — его. Вы отвечаете — и уже переводите деньги на незнакомый счёт. Только потом выясняется, что аккаунт знакомого был угнан, а голосовое — синтетическое.


Признаки дипфейк-звонка

Технологии пока не идеальны. Вот на что стоит обращать внимание:

  • Голос «правильный», но речь странная. Дипфейк хорошо воспроизводит тембр, но интонация при длинных фразах может быть немного «плоской», без живых эмоциональных перепадов.
  • Нет случайных звуков фона. Настоящий человек в реальной ситуации слышен в контексте: фоновые шумы, дыхание, случайные паузы. Синтетический голос часто звучит «в вакууме».
  • Пауза перед ответом. Если вы задаёте неожиданный вопрос, система может «подвиснуть» на долю секунды — дольше, чем обычный человек.
  • Звонок совпадает с другими признаками мошенничества: срочность, просьба о деньгах, секретность.

Однако самые продвинутые системы уже научились имитировать многие из этих нюансов. Поэтому лучшая защита — не распознавание дипфейка «на слух», а проверочный протокол.


Кодовое слово: как внедрить и использовать

Это самый практичный инструмент защиты. Работает просто: вы договариваетесь с близкими людьми о секретном слове или фразе. Если кто-то звонит «от имени» одного из вас и просит денег — второй может спросить кодовое слово. Мошенник его не знает.

Как договориться:

  1. Поговорите с родителями, детьми, близкими партнёрами лично.
  2. Выберите слово или фразу, которую легко запомнить, но которая не очевидна посторонним (не имя питомца, которое есть в соцсетях).
  3. Договоритесь: если кто-то звонит и «не помнит» кодовое слово — это сигнал тревоги.
  4. Напомните о кодовом слове через несколько месяцев — память имеет свойство стираться.

Пример: семья договаривается, что кодовое слово — «малиновый». Если кто-то звонит от имени мамы и просит деньги — можно спросить: «Какой у нас цвет?». Настоящая мама скажет «малиновый». Мошенник — нет.

⚠️ Важно: Кодовое слово должно быть известно только вашему близкому кругу. Не записывайте его в заметках телефона с пометкой «кодовое слово».


Что делать, если позвонили с подозрительным голосом

  1. Задайте личный вопрос, ответ на который знает только настоящий человек: «Как называлась наша любимая кафешка?», «Что я подарил тебе на день рождения?»
  2. Спросите кодовое слово, если оно есть.
  3. Положите трубку и перезвоните самостоятельно на знакомый номер.
  4. Напишите в мессенджер — это быстро покажет, в сети ли человек и что происходит на самом деле.
  5. Ничего не переводите до живого подтверждения личности.

Если вас уже обманули

Немедленно: заблокируйте карту, позвоните в банк, попросите отменить операцию.

В течение часа: подайте заявление в полицию с указанием всех деталей — времени, номера, суммы. Сохраните историю звонков.

Расскажите всем, кого знаете. Дипфейк-мошенники могут использовать один и тот же «голос» для нескольких атак. Ваши близкие должны знать, что такой звонок уже был.


Источники

  1. ФБР. Internet Crime Report 2024. ic3.gov
  2. Центр цифровой экспертизы Роскачества. Доклад о голосовых дипфейках, 2024. roskachestvo.gov.ru
  3. MIT Technology Review. «The voice cloning threat is real», 2024. technologyreview.com