NVIDIA заменила дорогой HBM на GDDR7 в Rubin CPX ради удешевления ИИ

NVIDIA представила новый ускоритель Rubin CPX (Content Phase aXcelerator), созданный для обработки длинного контекста при работе больших языковых моделей.

В отличие от классических «датацентровых» GPU с HBM, новинка оснащена 128 ГБ памяти GDDR7, что снижает стоимость и энергопотребление.

HBM3E и HBM4 обеспечивают огромную пропускную способность, но дороги в производстве, требуют сложной упаковки (CoWoS) и ограничивают выпуск.

GDDR7 же дешевле, доступнее и проще в интеграции, а для задач обработки контекста (миллионы токенов за раз) высокая пропускная способность не так критична.

Rubin CPX способен выдавать до 30 NVFP4 петафлопс вычислительной мощности, оснащён аппаратным ускорением attention-механизмов и поддерживает кодирование/декодирование видео.

Он будет использоваться вместе с GPU Rubin и CPU Vera в системах Vera Rubin NVL144 CPX, обеспечивающих до 8 экзафлопс мощности и 100 ТБ памяти в стойке.

Первые такие платформы ожидаются к концу 2026 года, а среди клиентов уже заявлены Cursor, Runway и Magic.