Материалы по тегу: mcm

09.04.2019 [11:35], Андрей Созинов

NVIDIA RC 18: прототип процессора для глубокого обучения из 36 отдельных кристаллов

Компания NVIDIA работает над созданием нового решения, предназначенного для работы с искусственным интеллектом, которое называется RC 18. Ключевой особенностью данного чипа является то, что он будет представлять собой «склейку» из нескольких кристаллов, то есть станет мультичиповым решением.

Инженеры NVIDIA Research создали прототип процессора, который состоит сразу из 36 модулей. Несмотря на столь большое количество кристаллов, площадь чипа довольно небольшая. Всё дело в том, что кристаллы весьма компактные, хоть и производятся по не самому «тонкому» 16-нм техпроцессу компанией TSMC. Напомним, что по таким же нормам производятся графические процессоры Pascal.

Каждый из 36 модулей состоит из 16 процессорных элементов (Processing Elements, PE), являющихся базовыми процессорными ядрами с архитектурой RISC-V Rocket. Кроме того, у модуля есть буфер памяти и восемь каналов GRS (Ground-Referenced Signaling) для операций ввода/вывода с общей пропускной способностью в 100 Гбайт/с, что весьма немало.

На данный момент RC 18 является скорее экспериментальной разработкой, нежели прототипом некоего готовящегося продукта. Этот многочиповый модуль (Multi-chip module, MCM) предназначен для ускорения глубокого обучения искусственного интеллекта и его главной особенностью является высокий уровень масштабируемости. То есть изменять производительность такого MCM-модуля куда проще, чем чипа с монолитным кристаллом, ведь можно просто добавлять или убирать кристаллы с процессорными элементами.

Чип RC 18 создан для ускорения процесса глубокого обучения, что само по себе не очень интересно для рядовых пользователей. Тем не менее, многие из технологий, которые делают возможным создание и работу данного многочипового модуля, могут найти применение в будущих графических процессорах NVIDIA. Компания ранее уже заявляла о том, что рассматривает варианты создания GPU из нескольких кристаллов. И RC 18 является одним из шагов на пути к этому.

«Этот чип (RC 18 — прим. ред.) обладает таким преимуществом, как способность продемонстрировать сразу множество технологий, — отмечает Билл Дэлли (Bill Dally), глава NVIDIA Research. — Одной из технологий является масштабируемая архитектура для глубокого обучения. Другой является очень эффективная технология интерконнекта на органической основе».

Некоторые из технологий, применённых в RC 18, однажды могут стать ключевыми при создании больших высокопроизводительных графических процессоров из нескольких кристаллов. Например, это может быть ячеистая топология, передача сигналов с малой задержкой с помощью GRS, объектно-ориентированный высокоуровневый синтез (Object-Oriented High-Level Synthesis, OOHLS) и технология GALS (Globally Asynchronous Locally Synchronous).

Заметим, что NVIDIA является не первой компанией, которая планирует создание графического процессора из нескольких кристаллов. Некоторое время назад компания AMD также говорила о том, что её шина Infinity Fabric, используемая в центральных процессорах, может найти применение в области GPU. Однако создание таких графических процессоров сопряжено с рядом трудностей, одна из которых заключается в том, чтобы заставить программное обеспечение воспринимать «склейку» как единый GPU. Иначе получится связка SLI или CrossFire, что для потребительских видеокарт означает не самую высокую эффективность. Но когда-то многочиповые модули могут стать вполне обычным явлением для настольных видеокарт.

Постоянный URL: http://servernews.ru/985537
25.08.2017 [13:59], Иван Грудцын

AMD: многочиповость EPYC экономит 41 % средств

Процессоры AMD с 14-нм архитектурой Zen пока радуют невысокими ценами на фоне конкурирующих решений Intel. Может показаться, что при определении стоимости CPU чипмейкер из Саннивейла прежде всего руководствуется необходимостью во что бы то ни стало отобрать у Intel как можно бóльшую долю рынка. Однако демпинг — не лучшая стратегия для компании, задолжавшей кредиторам порядка $2 млрд. Одним из ключевых факторов ценовой доступности старших процессоров Advanced Micro Devices является их низкая себестоимость, которая, в свою очередь, достигается за счёт модульной (MCM) конструкции. В ходе недавней конференции Hot Chips в г. Купертино (штат Калифорния, США) представителями AMD была озвучена величина экономии на разработку и производство модульных 32-ядерных CPU по сравнению с гипотетическими монолитными процессорами с тем же количеством ядер. Согласно AMD, окончательный вариант дизайна EPYC на 41 % дешевле проектирования и выпуска однокристального решения.

Как подчёркивается на вышеприведённом изображении, однокристальные EPYC могли бы быть на 10 % меньше четырёх чипов Zeppelin (суммарно), но выход годных CPU был бы в таком случае существенно ниже.

Нет сомнений, что производительность «теоретических» монолитных EPYC выше, однако если бы в Саннивейле отдали предпочтение одному крупному кристаллу вместо четырёх поменьше, то и серверы на базе таких процессоров обошлись бы заказчикам значительно дороже. Кроме того, стоит отметить, что использование восьмиядерных чипов Zeppelin в EPYC позволяет в случае необходимости нарастить производство Ryzen, ограничив при этом поставки серверных CPU.

Хотя процессоры EPYC предлагаются компанией AMD не первый день, их обзоров в Сети совсем немного. Большую работу проделали энтузиасты ServeTheHome, протестировав 2P-систему Supermicro на базе дуэта 32-ядерных EPYC 7601. По чистой производительности пара новичков уверенно опередила тандемы Intel Xeon E5-2699 v4 (Broadwell-EP, 22 ядра) и Intel Xeon Gold 6150 (Skylake-SP, 18 ядер). Однако учитывая, что такие крупные поставщики серверного ПО, как Microsoft и Oracle, выставляют счета в зависимости от количества ядер в серверах, стоимость владения высокопроизводительными системами AMD может нивелировать старания создателей EPYC.

Постоянный URL: http://servernews.ru/957550
Система Orphus