NVIDIA представила новую линейку локальных ИИ-моделей OpenReasoning-Nemotron, способных решать задачи на уровне OpenAI.
Серия включает четыре модели с 1,5, 7, 14 и 32 млрд параметров. Все они созданы на основе крупной 671-миллиардной модели DeepSeek, но в значительно более компактном виде, что позволяет запускать их на обычных игровых видеокартах.
Для обучения NVIDIA использовала 5 млн задач по математике, науке и программированию, созданных с помощью своей платформы NeMo Skills.
Модели обучались исключительно с применением супервизируемого обучения — без использования RLHF, что делает их удобной основой для дальнейших исследований.
TechPowerUp TechPowerUp
По результатам тестов, самая крупная 32B-модель достигает 89,2 баллов на олимпиаде AIME24 и 73,8 на HMMT, а младшая 1.5B показывает 55,5 и 31,5 соответственно. В режиме GenSelect, который генерирует несколько ответов параллельно и выбирает лучший, производительность 32B-модели сравнима или даже превосходит модель o3-high от OpenAI.
Все четыре модели NVIDIA уже доступны на Hugging Face для загрузки и локального использования.