Специалисты Новосибирского государственного университета представили усовершенствованную систему распознавания русской речи на основе искусственного интеллекта (ИИ). Разработка создана на базе нейросети Whisper от OpenAI с дополнительным обучением.
Как пояснил научный сотрудник Иван Бондаренко, система прошла тренировку на более чем 500 часах разговорной русской речи. Для расширения база данных исследователи применяли синтез данных с помощью других нейронных сетей.
Основное применение разработки включает точное воспроизведение русской речи и ее перевод на английский язык. В настоящее время обработка запроса занимает около 40 секунд, но разработчики планируют сократить это время до 5 секунд в ближайшие месяцы.