Подделать голос любого человека с современными технологиями стало возможно. Появилась особая нейросеть: с помощью определенного алгоритма получится имитировать голос человека.

Подделать голос: уже реальность

Казалось бы, что такого в том, что можно подделать голос любого человека? Пользователи в интернете находят в этом массу плюсов. Например, теперь можно будет смотреть фильмы в дубляже, но с реальными голосами актеров. Захватывающе.

Однако имитация голоса также открывает массу возможностей для мошенников. Они могут звонить пожилым родственникам и представляться кем угодно. Или, например, проходить процедуры идентификации в банковских сервисах.

Как же это возможно

В нейросети. Специалисты создали определенный алгоритм, который может взять любой аудиофайл, «запомнить» голос и сымитировать его, повторив абсолютно любой новый текст голосом с исходного аудиофайла.

Процесс называется text-to-speech или «текст в речь». В разработке применили нейросетевые модели Tacotron 2 и WaveNet. Причем тесты прошли более года назад, летом 2018 года. На данный момент опубликовали и результаты работы, и даже открытый исходный код. Это значит, что программа доступна для всех желающих ее использовать.

Для старта программы достаточно всего двух аудио. На первом надо записать тот голос, который система должна сымитировать. На втором — ту фразу, которую планируют воспроизвести. Алгоритм практически онлайн имитирует голос из первого файла, повторяя фразы из второго. И эта имитация достаточно высокого качества.

Фото: Firestock.