Материалы по тегу: gp104

13.09.2016 [15:03], Иван Грудцын

NVIDIA представила ускорители Tesla P40 и Tesla P4

В ассортименте специализированных ускорителей компании NVIDIA появились модели Tesla P40 и Tesla P4, предназначенные для решения задач из области так называемого глубокого обучения (англ. deep learning). С помощью данных устройств самообучающиеся системы могут не только очень быстро делать логические выводы, но и анализировать десятки потоков видео одновременно. Новые адаптеры пришли на смену ускорителям поколения Maxwell — Tesla M40 и Tesla M4.

Tesla P40 использует полную версию графического процессора GP102, который, в свою очередь, является упрощённым вариантом HPC-чипа GP100. Карта оперирует 3840 потоковыми процессорами Pascal, 240 текстурными блоками (TMU), 96 блоками рендеринга (ROP), 384-разрядной шиной памяти и 24 Гбайт локальной памяти стандарта GDDR5. Применение относительно медленных микросхем буферной RAM, работающих на частоте 1800 (7200) МГц, сочетается у Tesla P40 с невысоким номиналом GPU — от 1303 МГц (базовая частота) до 1531 МГц (boost-режим). Пропускная способность подсистемы памяти равна 346 Гбайт/с.

 NVIDIA Tesla P40

Энергопотребление модели P40 при полной загрузке GPU составляет в среднем 250 Вт, как и у NVIDIA TITAN X. Система охлаждения выполнена в виде крупного двухслотового радиатора, который должен продуваться вентиляторами серверных стоек. Габариты Tesla P40 равны 267(Д) × 112(Ш) × ~40(В) мм. В соответствии со спецификацией, ускоритель характеризуется производительностью в 12 TFLOPS при операциях с числами одинарной точности и 47 TOPS при целочисленных (INT8) операциях. Кроме того, поддерживается одновременный анализ 35 потоков видео формата H.264.

Возможности Tesla P4 скромнее ввиду использования ядра Pascal GP104. Чип содержит 2560 потоковых процессоров, 160 текстурных блоков, 64 блока растровых операций, шину памяти разрядностью 256 бит и 8 Гбайт GDDR5. Частота GPU довольно мала как для собрата GeForce GTX 1080 — от 810 до 1063 МГц. Микросхемы RAM работают на номинальных 1500 (6000) МГц, обеспечивая общую пропускную способность в 192 Гбайт/с. В зависимости от задач, Tesla P4 может иметь лимит мощности в 50 или 75 Вт. Дополнительное питание карте не требуется.

 NVIDIA Tesla P4

Модель P4 выполнена в виде низкопрофильного адаптера с пассивной СО. Устройство демонстрирует производительность в 5,5 TFLOPS (числа одинарной точности) и 22 TOPS (целые числа). Как и P40, её «младшая сестра» может анализировать 35 видеопотоков в режиме реального времени.

Ускоритель Tesla P40 будет задействоваться в составе серверов от авторизованных партнёров NVIDIA начиная с октября, а Tesla P4 дебютирует в ноябре.

Постоянный URL: http://www.servernews.ru/939332
26.07.2016 [00:19], Иван Грудцын

NVIDIA представила видеоускорители Quadro P6000 и P5000

«Тяжеловес» рынка дискретной графики NVIDIA продолжает расширять ассортимент видеоадаптеров на 16-нм чипе Pascal GP100. До сегодняшнего дня калифорнийская компания анонсировала эталонный вариант GP100 с 3840 потоковыми процессорами, HPC-ускоритель Tesla P100 с интерфейсами NVLink и PCI Express, а также объявила о грядущем выходе видеокарты NVIDIA Titan X для широкого круга задач, включая игры и работу в GPU-ускоренных приложениях. Теперь же пришло время для анонса видеоадаптера Quadro P6000 (3584 ядра CUDA, 384-разрядная шина памяти), компанию которому составила модель Quadro P5000 на полнофункциональном чипе GP104 с 2560 ядрами CUDA и 256-битной шиной RAM.

Устройства Quadro последних поколений всегда выделялись внушительным объёмом буферной памяти, и карты Quadro P6000 не стали в этом плане исключением. Впрочем, ради увеличения общей ёмкости микросхем RAM инженеры NVIDIA принесли в жертву скорость доступа к ним (как и в Titan X): чипы HBM2 уступили место памяти GDDR5X суммарным объёмом 24 Гбайт. Тот же тип RAM задействован и в ускорителе Quadro P5000, который располагает вдвое большим объёмом локальной памяти (16 Гбайт) по сравнению с игровым GeForce GTX 1080. Производительность Quadro P6000 в FP32-вычислениях NVIDIA оценила в 12 TFLOPS.

Оба новых видеоускорителя Quadro характеризуются наличием разъёмов для вывода изображения DVI-D и DisplayPort 1.4 (4 шт.). С их помощью можно организовать рабочее пространство из четырёх мониторов с разрешением 4096 × 2160 пикселей при 120 Гц или 5120 × 2880 при 60 Гц. Активное охлаждение Quadro P6000/P5000 открывает возможность интеграции данных устройств в состав моделей серверов и рабочих станций, которые не оборудованы высокопроизводительными вентиляторами или СЖО.

 NVIDIA Quadro P6000, P5000
 NVIDIA Quadro P6000, P5000

NVIDIA подчёркивает, что новинки семейства Quadro должны справиться с практически с любыми задачами, в том числе теми, которые нецелесообразно выполнять на профессиональных картах поколений Kepler и Maxwell ввиду больших временных и эксплуатационных затрат. Так, Quadro P6000 способна отрисовывать очень большие CAD-модели, фотореалистичные сцены, выполнять GPGPU-вычисления и решать задачи, связанные с прогнозированием сейсмической активности. У Quadro P5000 возможности скромнее: работа с большими (сложными) объектами в CAD-приложениях, вычисления, связанные с сейсмическими исследованиями, отрисовка сложных DCC-эффектов и объёмных изображений в медицине (например, воссоздание моделей органов человека на основе вводных данных).

Видеоускорители NVIDIA Quadro P6000 и P5000 появятся у авторизованных поставщиков в октябре текущего года. Рекомендованные цены продуктов пока не объявлены.

Постоянный URL: http://www.servernews.ru/936733
Система Orphus