NVIDIA представила новый ускоритель Rubin CPX (Content Phase aXcelerator), созданный для обработки длинного контекста при работе больших языковых моделей.
В отличие от классических «датацентровых» GPU с HBM, новинка оснащена 128 ГБ памяти GDDR7, что снижает стоимость и энергопотребление.
HBM3E и HBM4 обеспечивают огромную пропускную способность, но дороги в производстве, требуют сложной упаковки (CoWoS) и ограничивают выпуск.
GDDR7 же дешевле, доступнее и проще в интеграции, а для задач обработки контекста (миллионы токенов за раз) высокая пропускная способность не так критична.
Rubin CPX способен выдавать до 30 NVFP4 петафлопс вычислительной мощности, оснащён аппаратным ускорением attention-механизмов и поддерживает кодирование/декодирование видео.
Он будет использоваться вместе с GPU Rubin и CPU Vera в системах Vera Rubin NVL144 CPX, обеспечивающих до 8 экзафлопс мощности и 100 ТБ памяти в стойке.
Первые такие платформы ожидаются к концу 2026 года, а среди клиентов уже заявлены Cursor, Runway и Magic.