Российские специалисты из T-Bank AI Research разработали новый способ обучения языковых моделей искусственного интеллекта (ИИ), который позволяет повысить точность их ответов на 15%. Это достижение значительно улучшит работу виртуальных ассистентов и чат-ботов в различных областях, от образования до медицины.
Современные языковые модели часто сталкиваются с проблемой снижения качества ответов при длительном обучении. Ученые предложили метод, основанный на улучшении существующего подхода Trust Region, который позволяет более эффективно обучать нейронные сети. Новый метод показал улучшения по пяти ключевым параметрам: точности, логике, связности, стилю и информативности текста.
Кроме того, метод помог нейросетям избегать случайных ошибок и нежелательных странных фраз, которые иногда появляются при обучении на узкопрофильные задачи. Преимущество нового подхода в его простой реализации и совместимости с уже существующими технологиями.