На международной конференции ACL 2025 исследователи Сбера представили инновационный подход к созданию русскоязычных языковых моделей. В статье «Семейство GigaChat: эффективное моделирование русского языка с помощью архитектуры смеси экспертов» описана технология, которая ускоряет работу искусственного интеллекта (ИИ) в два раза по сравнению с существующими аналогами.
Ключевая особенность разработки — использование архитектуры «смесь экспертов» (MoE). Эта система работает по принципу команды специалистов, где для каждой задачи активируются только нужные модули. Такой подход не только повышает скорость обработки данных, но и снижает затраты вычислительных ресурсов.
Особое значение имеет создание специального токенизатора, оптимизированного для русского языка. Этот инструмент позволяет точнее управлять тематикой ответов ИИ, учитывая лингвистические и культурные особенности.
Младшая версия модели уже доступна для свободного использования. По словам технического директора GigaChat Фёдора Минькина, технология открывает новые возможности для бизнеса — от автоматизации поддержки клиентов до генерации контента. Разработчики также предоставили доступ к коду и весам моделей, что ускорит исследования в области искусственного интеллекта.