Разработчики нейросети DeepSeek анонсировали обновлённую модель VL2, способную распознавать информацию на изображениях.
Серия новых моделей DeepSeek-VL2 построена на основе метода Mixture of Experts (MoE), позволяющего объединять несколько нейросетей для решения комплексных задач. В серию разработчики включили модели DeepSeek-VL2-Tiny, VL2-Small и VL2, которые содержат 1 млрд, 2,8 млрд и 4,5 млрд параметров соответственно. По сообщениям разработчиков, новая модель превосходит текущую, DeepSeek-VL.
Новая нейросеть обучена понимать и объяснять содержание документов, таблиц и диаграмм, считывать информацию с фото продуктов и подбирать под них рецепты. К тому же, и об этом пишут пользователи, испытавшие нейросеть в деле, обновлённая DeepSeek распознаёт письменный текст и даже может его напечатать.