Оружие против цифровых фантомов: как МТС учит ИИ распознавать дипфейки с точностью 98% - Telecom Times

Российские технологии вступают в гонку вооружений с генеративным ИИ: в МТС Web Services представили детектор дипфейков нового поколения, способный с высочайшей точностью выявлять синтетический контент, созданный самыми продвинутыми моделями вроде Veo 3 и Sora 2.

В ноябре 2025 года цифровая экосистема МТС анонсировала систему, которая может стать критически важным инструментом защиты информационного пространства. Детектор дипфейков от МТС Web Services (MWS) демонстрирует точность распознавания свыше 98% — и это в условиях, когда генеративные модели учатся обманывать существующие системы детекции всего за несколько месяцев.

Архитектура защиты: два уровня обороны

Система построена на комплексном анализе контента через два независимых канала детекции:

Аудиодетектор MWS AI использует инновационный подход к обучению: сначала модель изучает сырые записи человеческой речи, чтобы понять естественные звуковые паттерны, а затем дообучается на синтетических записях, выявляя характерные артефакты сгенерированного голоса. Результаты впечатляют: точность распознавания аудиодипфейков достигает 84% для Veo 3 и 93% для Sora 2.
Визуальный детектор VisionLabs показывает стабильно высокие результаты — 93,9% для видео, созданных Veo 3, и 93,6% для Sora 2. Сейчас ведется работа по объединению обеих технологий в единый интерфейс с целевой точностью выше 98%.

Скорость как стратегическое преимущество

Ключевым прорывом стала не только точность, но и скорость адаптации к новым угрозам.

«С моделями Veo 3 и Sora 2 мы смогли провести адаптацию всего за две недели — и именно это сейчас наше главное преимущество», — подчеркивает генеральный директор МТС Web Services Павел Воронин.

Эта способность к быстрому дообучению критически важна в условиях, когда каждый месяц появляются новые, более совершенные генеративные модели, способные обходить существующие системы защиты.

Ограничения: битва с ложными срабатываниями

Одной из серьезных проблем остается рост показателя False Rejection Rate (FRR) — случаев, когда система ошибочно принимает реальный голос за синтезированный. Как отмечают разработчики, FRR может достигать 4,5-7,2% при анализе записей, обработанных инструментами шумоподавления или голосовыми фильтрами.

Это создает практические сложности для массового внедрения, поскольку требует тонкой настройки алгоритмов под конкретные условия использования.

Практическое внедрение: от банков до госсектора

Уже сейчас система проходит тестирование в нескольких ключевых сегментах:

В платформе для видеоконференций МТС Линк,
В сервисе «Защитник», предупреждающем о разговоре с возможным мошенником,
В одном из государственных сервисов России,
В трех банках России и СНГ.

Такой широкий охват свидетельствует о высоком спросе на технологии детекции дипфейков across различных отраслей — от финансовой безопасности до защиты государственной информации.

Контекст цифровой эпохи: почему это важно

Разработка МТС появляется в момент, когда угроза дипфейков перешла из теоретической плоскости в практическую. Возможность создавать убедительные поддельные видео с политиками и общественными деятелями или фейковые ролики о катастрофах представляет реальную опасность .

Детектор дипфейков МТС — это не просто технологический продукт, а элемент цифрового суверенитета, позволяющий противодействовать массовым манипуляциям и информационным атакам.

Российская разработка демонстрирует, что в гонке между создателями и детекторами дипфейков возможно не только догоняющее развитие, но и создание опережающих решений. Умение быстро адаптироваться к новым генеративным моделям может стать решающим фактором в защите цифрового пространства в ближайшие годы.

Фото: Firestock.