Специалисты Национального исследовательского ядерного университета МИФИ разработали систему для обнаружения поддельных голосовых записей. Нейросеть под названием «Сипуха» анализирует аудиосигналы и определяет, является ли голос настоящим или синтезированным.
Разработка основана на анализе кепстральных коэффициентов — математических характеристик звука. Для обучения системы использовали более 200 тысяч записей, включая как реальные голоса, так и дипфейки, созданные разными алгоритмами.
Первоначально проект начинался как академическое исследование в 2022 году, но с распространением мошеннических схем с поддельными голосами приобрел практическую ценность. Система уже прошла испытания в Технологическом акселераторе МИФИ и Росатома, войдя в число лучших разработок.
Сейчас команда работает над созданием облачного сервиса, который сможет интегрироваться с колл-центрами и мессенджерами. Интерес к технологии уже проявили несколько крупных российских компаний.
Разработчики отмечают, что нейросеть требует постоянного совершенствования, так как методы создания дипфейков непрерывно развиваются. В планах — создание специализированной лаборатории для дальнейшего улучшения системы. Проект стал победителем конкурса «Новатор Москвы» и может получить поддержку городских властей.
«Сипуха» получила свое название в честь птицы с исключительным слухом.