Российские технологии вступают в гонку вооружений с генеративным ИИ: в МТС Web Services представили детектор дипфейков нового поколения, способный с высочайшей точностью выявлять синтетический контент, созданный самыми продвинутыми моделями вроде Veo 3 и Sora 2.
В ноябре 2025 года цифровая экосистема МТС анонсировала систему, которая может стать критически важным инструментом защиты информационного пространства. Детектор дипфейков от МТС Web Services (MWS) демонстрирует точность распознавания свыше 98% — и это в условиях, когда генеративные модели учатся обманывать существующие системы детекции всего за несколько месяцев.
Архитектура защиты: два уровня обороны
Система построена на комплексном анализе контента через два независимых канала детекции:
- Аудиодетектор MWS AI использует инновационный подход к обучению: сначала модель изучает сырые записи человеческой речи, чтобы понять естественные звуковые паттерны, а затем дообучается на синтетических записях, выявляя характерные артефакты сгенерированного голоса. Результаты впечатляют: точность распознавания аудиодипфейков достигает 84% для Veo 3 и 93% для Sora 2.
- Визуальный детектор VisionLabs показывает стабильно высокие результаты — 93,9% для видео, созданных Veo 3, и 93,6% для Sora 2. Сейчас ведется работа по объединению обеих технологий в единый интерфейс с целевой точностью выше 98%.
Скорость как стратегическое преимущество
Ключевым прорывом стала не только точность, но и скорость адаптации к новым угрозам.
«С моделями Veo 3 и Sora 2 мы смогли провести адаптацию всего за две недели — и именно это сейчас наше главное преимущество», — подчеркивает генеральный директор МТС Web Services Павел Воронин.
Эта способность к быстрому дообучению критически важна в условиях, когда каждый месяц появляются новые, более совершенные генеративные модели, способные обходить существующие системы защиты.
Ограничения: битва с ложными срабатываниями
Одной из серьезных проблем остается рост показателя False Rejection Rate (FRR) — случаев, когда система ошибочно принимает реальный голос за синтезированный. Как отмечают разработчики, FRR может достигать 4,5-7,2% при анализе записей, обработанных инструментами шумоподавления или голосовыми фильтрами.
Это создает практические сложности для массового внедрения, поскольку требует тонкой настройки алгоритмов под конкретные условия использования.
Практическое внедрение: от банков до госсектора
Уже сейчас система проходит тестирование в нескольких ключевых сегментах:
- В платформе для видеоконференций МТС Линк,
- В сервисе «Защитник», предупреждающем о разговоре с возможным мошенником,
- В одном из государственных сервисов России,
- В трех банках России и СНГ.
Такой широкий охват свидетельствует о высоком спросе на технологии детекции дипфейков across различных отраслей — от финансовой безопасности до защиты государственной информации.
Контекст цифровой эпохи: почему это важно
Разработка МТС появляется в момент, когда угроза дипфейков перешла из теоретической плоскости в практическую. Возможность создавать убедительные поддельные видео с политиками и общественными деятелями или фейковые ролики о катастрофах представляет реальную опасность .
Детектор дипфейков МТС — это не просто технологический продукт, а элемент цифрового суверенитета, позволяющий противодействовать массовым манипуляциям и информационным атакам.
Российская разработка демонстрирует, что в гонке между создателями и детекторами дипфейков возможно не только догоняющее развитие, но и создание опережающих решений. Умение быстро адаптироваться к новым генеративным моделям может стать решающим фактором в защите цифрового пространства в ближайшие годы.
Фото: Firestock.
