Вы берёте трубку — и слышите голос своего сына. Или лучшей подруги. Или директора. Голос как настоящий: та же интонация, те же характерные паузы, тот же акцент. Человек просит срочно помочь деньгами или передать важные данные. Вы помогаете — и только потом узнаёте, что настоящий сын был в это время в другом городе и вам не звонил. Добро пожаловать в эпоху голосовых дипфейков. По данным ФБР, в 2024 году убытки от атак с использованием синтетических голосов и дипфейков в США превысили 25 млн долларов только по задокументированным случаям — и цифра продолжает расти.
Как работает клонирование голоса
Объяснить это несложно, даже если вы далеки от технологий.
Представьте, что у вас есть запись чьего-то голоса — несколько минут речи. Специальная программа «прослушивает» эту запись тысячи раз, запоминает всё: высоту голоса, темп, тембр, характерные звуки при дыхании, манеру произносить отдельные слова. Затем — это самое важное — программа может говорить этим голосом всё, что угодно. Вы пишете текст, а на выходе получаете аудиофайл, в котором конкретный человек «произносит» этот текст.
Именно это делают инструменты вроде ElevenLabs, RVC (Retrieval-based Voice Conversion) и десятки аналогов. Раньше такие технологии были доступны только крупным студиям. Сегодня это бесплатные или дешёвые сервисы, доступные любому человеку с интернетом.
Сколько нужно голоса? Для первых инструментов требовались часы записи. Современные системы справляются с 30–60 секундами. То есть один короткий видеоролик в соцсети, голосовое сообщение в мессенджере, интервью на YouTube — этого достаточно.
Откуда мошенники берут образцы голоса
Вот здесь начинается самое неприятное. Большинство из нас уже «сдали» свой голос — просто не задумываясь об этом.
Социальные сети. Видео в Instagram Reels, TikTok, ВКонтакте — это готовый аудиоматериал. Даже видео с фоновой музыкой: современные алгоритмы умеют вычленять голос из шума.
YouTube и подкасты. Если вы ведёте канал, записываете видеоуроки, выступаете на конференциях — у мошенников есть часы вашего голоса.
Голосовые сообщения в мессенджерах. Если ваш телефон или аккаунт в мессенджере когда-либо был взломан, а в нём хранятся голосовые — они могут попасть к злоумышленникам.
Телефонные разговоры. Некоторые схемы предполагают предварительный «нейтральный» звонок, во время которого с вас записывают голос. «Здравствуйте, это социологическое исследование, ответьте на несколько вопросов» — несколько минут записи уже получено.
Корпоративные утечки. Голосовые записи совещаний, вебинаров, внутренних звонков — всё это потенциальный материал.
⚠️ Важно: Если ваш ребёнок, родитель или другой близкий человек активно ведёт соцсети или YouTube-канал — его голос доступен для клонирования. Это не повод запрещать контент, но повод заранее договориться о кодовом слове.
Как выглядит атака на практике
Сценарий 1: Звонок от «сына»
Пожилые родители получают звонок. Голос — точь-в-точь их сына — говорит, что попал в беду: авария, задержание, больница. Просит срочно перевести деньги. Дальше разговор переходит к «следователю» или «сотруднику банка» — уже в стандартной схеме. Но первый голос — настоящая наживка, которая снимает всякий скептицизм.
Сценарий 2: «Руководитель» на работе
Сотруднику звонит человек с голосом директора и просит срочно перевести деньги поставщику или поделиться важными данными. «Я сейчас на переговорах, всё срочно, сделай прямо сейчас и не говори пока финансовому отделу». Эта схема в международной практике называется CEO fraud («мошенничество с руководителем») — по данным ФБР, только за 2024 год компании потеряли на ней сотни миллионов долларов.
Сценарий 3: Голосовое сообщение в мессенджере
Вам приходит голосовое сообщение от знакомого с просьбой срочно помочь деньгами. Голос — его. Вы отвечаете — и уже переводите деньги на незнакомый счёт. Только потом выясняется, что аккаунт знакомого был угнан, а голосовое — синтетическое.
Признаки дипфейк-звонка
Технологии пока не идеальны. Вот на что стоит обращать внимание:
- Голос «правильный», но речь странная. Дипфейк хорошо воспроизводит тембр, но интонация при длинных фразах может быть немного «плоской», без живых эмоциональных перепадов.
- Нет случайных звуков фона. Настоящий человек в реальной ситуации слышен в контексте: фоновые шумы, дыхание, случайные паузы. Синтетический голос часто звучит «в вакууме».
- Пауза перед ответом. Если вы задаёте неожиданный вопрос, система может «подвиснуть» на долю секунды — дольше, чем обычный человек.
- Звонок совпадает с другими признаками мошенничества: срочность, просьба о деньгах, секретность.
Однако самые продвинутые системы уже научились имитировать многие из этих нюансов. Поэтому лучшая защита — не распознавание дипфейка «на слух», а проверочный протокол.
Кодовое слово: как внедрить и использовать
Это самый практичный инструмент защиты. Работает просто: вы договариваетесь с близкими людьми о секретном слове или фразе. Если кто-то звонит «от имени» одного из вас и просит денег — второй может спросить кодовое слово. Мошенник его не знает.
Как договориться:
- Поговорите с родителями, детьми, близкими партнёрами лично.
- Выберите слово или фразу, которую легко запомнить, но которая не очевидна посторонним (не имя питомца, которое есть в соцсетях).
- Договоритесь: если кто-то звонит и «не помнит» кодовое слово — это сигнал тревоги.
- Напомните о кодовом слове через несколько месяцев — память имеет свойство стираться.
Пример: семья договаривается, что кодовое слово — «малиновый». Если кто-то звонит от имени мамы и просит деньги — можно спросить: «Какой у нас цвет?». Настоящая мама скажет «малиновый». Мошенник — нет.
⚠️ Важно: Кодовое слово должно быть известно только вашему близкому кругу. Не записывайте его в заметках телефона с пометкой «кодовое слово».
Что делать, если позвонили с подозрительным голосом
- Задайте личный вопрос, ответ на который знает только настоящий человек: «Как называлась наша любимая кафешка?», «Что я подарил тебе на день рождения?»
- Спросите кодовое слово, если оно есть.
- Положите трубку и перезвоните самостоятельно на знакомый номер.
- Напишите в мессенджер — это быстро покажет, в сети ли человек и что происходит на самом деле.
- Ничего не переводите до живого подтверждения личности.
Если вас уже обманули
Немедленно: заблокируйте карту, позвоните в банк, попросите отменить операцию.
В течение часа: подайте заявление в полицию с указанием всех деталей — времени, номера, суммы. Сохраните историю звонков.
Расскажите всем, кого знаете. Дипфейк-мошенники могут использовать один и тот же «голос» для нескольких атак. Ваши близкие должны знать, что такой звонок уже был.
Источники
- ФБР. Internet Crime Report 2024. ic3.gov
- Центр цифровой экспертизы Роскачества. Доклад о голосовых дипфейках, 2024. roskachestvo.gov.ru
- MIT Technology Review. «The voice cloning threat is real», 2024. technologyreview.com