Китайский стартап DeepSeek представил обновлённую версию своей ИИ-модели — V3.1, которая получила расширенный контекст для обработки длинных диалогов.
Это позволит системе лучше удерживать детали в памяти и вести более связные разговоры даже при большом объёме данных.
Анонс состоялся в официальной группе компании в WeChat. Подробной документации пока нет и модель не выложена на такие платформы, как Hugging Face.
Однако сам факт выпуска V3.1 показывает быстрый темп развития DeepSeek и стремление конкурировать с западными разработчиками.
Компания из Ханчжоу уже привлекла внимание благодаря модели R1, которая в ряде тестов обошла западные аналоги.
Теперь же пользователи ждут выхода R2. Правда, ее запуск откладывается — по сообщениям СМИ, дело в стремлении CEO стартапа, Лян Вэньфэна, довести модель до идеала и устранить технические ошибки.