Материалы по тегу: arm

12.04.2021 [19:34], Владимир Мироненко

NVIDIA развивает Arm-экосистему: GPU-инстансы с Graviton2, набор HPC-разработчика на базе Ampere Altra и новые партнёрства с Marvell, MediaTek и SiPearl

Собственный серверный Arm-процессор NVIDIA Grace ещё не вышел, но компания уже формирует экосистему вокруг Arm и собственных ускорителей. NVIDIA анонсировала серию совместных проектов с использованием своих GPU и программного обеспечения с процессорами на базе Arm для широкого круга рабочих нагрузок — от облака до периферии.

В частности, анонсированы инстансы Amazon EC2 на базе AWS Graviton2 с графическими процессорами NVIDIA, поддержка разработки научных приложений и ИИ-приложений с помощью нового набора разработчиков HPC, повышение уровня видеоаналитики и функций безопасности на границе сети, а также создание нового класса ПК на базе Arm с графическими процессорами NVIDIA RTX.

В частности, NVIDIA и AWS объявили о совместном проекте по развёртыванию Arm-экземпляров с графическими процессорами в облаке. Новые экземпляры Amazon EC2 позволят разработчикам запускать Android-игры в AWS, ускорять рендеринг и кодирование, а также транслировать игры на мобильные устройства.

Также NVIDIA представила набор NVIDIA Arm HPC Developer Kit, который включает сервер с 80-ядерным процессором Ampere Altra с тактовой частотой до 3,3 ГГц, два ускорителя NVIDIA A100, а также два DPU NVIDIA BlueField-2, которые ускоряют решение ключевых задач безопасности, передачи и хранения данных в ЦОД, включая изоляцию, , управление ключами, RDMA / RoCE, GPU Direct, хранение эластичных блоков, сжатие данных и многое другое.

Для этой платформы компания предлагает NVIDIA HPC SDK: набор компиляторов, библиотек и инструментов, которые позволяют создавать и переносить GPU-приложения HPC и ИИ в Arm-окружение. Среди первых ведущих вычислительных центров, развернувших новые платформы разработки, есть Ок-Риджская национальная лаборатория, Национальная лаборатория Лос-Аламоса и Университет Стоуни-Брук в США, а также Национальный центр высокопроизводительных вычислений на Тайване и Корейский институт науки и техники. NVIDIA Arm HPC Developer Kit будет доступен в 3 квартале 2021 года.

В области периферийных вычислений NVIDIA объявила о расширении сотрудничества с Marvell с целью объединения DPU OCTEON с графическими процессорами для ускорения облачных, корпоративных, операторских и пограничных приложений, и, в целом, повышения производительности систем и сокращения задержек от периферии до облака.

В категории ПК компания сотрудничает с MediaTek, одним из крупнейших мировых поставщиков SoC на базе Arm, чтобы создать эталонную платформу, поддерживающую Chromium, Linux и NVIDIA SDK. Сочетание графических процессоров NVIDIA RTX с высокопроизводительными, энергоэффективными процессорами Arm Cortex позволит использовать в ноутбуках графику с трассировкой лучей и искусственный интеллект.

Кроме того, NVIDIA сотрудничает и с другими партнёрами, включая Fujitsu и SiPearl. Первая, напомним, разработала самый мощный в мире суперкомпьютер Fugaku, который по совместительству является и самой производительной системой на базе Arm-процессоров, пусть и довольно специфичных. Вторая же пока всё ещё занимается разработкой Arm-процессоров SiPearl Rhea для будущих европейских суперкомпьютеров.

Постоянный URL: http://servernews.ru/1037079
12.04.2021 [19:26], Игорь Осколков

NVIDIA анонсировала серверные Arm-процессоры Grace и будущие суперкомпьютеры на их базе

В рамках GTC’21 NVIDIA анонсировала Arm-процессоры Grace серверного класса, которые станут компаньонами будущих ускорителей компании. Это не означает полный отказ от x86-64, но это позволит компании предложить клиентам более глубоко оптимизированные, а, значит, и более быстрые решения. NVIDIA говорит, что новый CPU позволит на порядок повысить производительность систем на его основе в ИИ и HPC-задачах в сравнении с современными решениями.

Процессор назван в честь Грейс Хоппер (Grace Hopper), одного из пионеров информатики и создательницы целого ряда основополагающих концепций и инструментов программирования. И это имя нам уже встречалось в контексте NVIDIA — в конце 2019 года компания зарегистрировала торговую марку Hopper для MCM-решений.

Компания не готова раскрыть полные технически характеристики новинки, которая станет доступна в начале 2023 года, но приводит некоторые интересные детали. В частности, процессор будет использовать Arm-ядра Neoverse следующего поколения (надо полагать, уже на базе ARMv9),  которые позволят получить в SPECrate2017_int_base результат выше 300. Для сравнения — система с парой современных AMD EPYC 7763 в том же бенчмарке показывает результат на уровне 800.

Вторая особенность Grace — использование памяти LPDRR5X (с ECC, естественно). В сравнении с DDR4 она будет иметь вдвое большую пропускную способность (ПСП) и в 10 раз меньшее энергопотребление. Число и скорость каналов памяти не уточняются, но говорится о суммарной ПСП в более чем 500 Гбайт/с на процессор. А у того же EPYC 7763 теоретический пик ПСП чуть больше 200 Гбайт/с. Очевидно, что другие процессоры к моменту выхода NVIDIA Grace тоже увеличат и производительность, и пропускную способность памяти. Гораздо более интересный вопрос, сколько линий PCIe 5.0 они смогут предложить. Если допустить, что у них будет 128 линий, то общая скорость для них составит чуть больше 500 Гбайт/с.

И NVIDIA этого мало — процессоры Grace получат прямое, кеш-когерентное подключение к GPU по NVLInk 4.0 (14x) с суммарной пропускной способностью боле 900 Гбайт/с. GPU тоже, как и прежде, будут общаться напрямую друг с другом по NVLink. Скорость связи между двумя CPU превысит 600 Гбайт/с, а в сборке из четырёх модулей CPU+GPU суммарная скорость обмена данными между системной памятью процессоров и GPU в такой mesh-сети составит 2 Тбайт/с. Но самое интересное тут то, что у памяти CPU (LPDDR5X) и GPU (HBM2e) в такой системе будет единое адресное пространство. Собственно говоря, таким образом компания решает давно назревшую проблему дисбаланса между скоростью обмена данными и доступным объёмом памяти в различных частях вычислительного комплекса.

Для сравнения можно посмотреть на архитектуру нынешних DGX A100 или HGX. У каждого ускорителя A100 есть 40 или 80 Гбайт набортной памяти HBM2e (1555 или 2039 Гбайт/с соответственно) и NVLInk-подключение на 600 Гбайт/c, которое идёт к коммутатору NVSwitch, имеющего суммарную пропускную способность 1,8 Тбайт/с. Всего таких коммутаторов шесть, а объединяют они восемь ускорителей. Внутри этой NVLInk-фабрики сохраняется достаточно высокая скорость обмена данными, но как только мы выходим за её пределы, ситуация меняется.

Схема NVIDIA DGX A100. Источник: Microway

Схема NVIDIA DGX A100. Источник: Microway

Каждый ускоритель A100 имеет второй интерфейс — PCIe 4.0 x16 (64 Гбайт/с), который уходит к PCIe-коммутатору, каковых в DGX A100 имеется четыре. Коммутаторы, в свою очередь, объединяют между собой сетевые 200GbE-адаптеры (суммарно в дуплексе до 1,6 Тбайт/с для связи с другими DGX A100), NVMe-накопители и CPU. У каждого CPU может быть довольно много памяти (от 512 Гбайт), но её скорость ограничена упомянутыми выше 200 Гбайт/c.

Узким местом во всей этой схеме является как раз PCIe, поэтому переход исключительно на NVLInk позволит NVIDIA получить большой объём памяти при сохранении приемлемой ПСП, не тратясь лишний раз на дорогую локальную HBM2e у каждого GPU. Впрочем, если компания не переведёт на NVLink и собственные будущие DPU Bluefield-3 (400GbE), которые будут скармливать связке CPU+GPU по, например, GPUDirect Storage данные из внешних NVMe-oF хранилищ и объединять узлы DGX POD, то PCIe 5.0 в составе Grace стоит ждать. Это опять-таки упростит и повысит эффективность масштабирования.

В целом, всё это необходимо из-за быстрого роста объёма ИИ-моделей — в GPT-3 уже 175 млрд параметров, а в течение пары лет можно ожидать модели уже с 0,5-1 трлн параметров. Им потребуются не только новые решения для обучения, но и для инференса. То же касается и физических расчётов — модели становятся всё больше и требовательнее + ИИ здесь тоже активно внедряется. Параллельно с разработкой Grace NVIDIA развивает программную экосистему вокруг Arm и своих решений, готовя почву для будущих систем на их основе.

Одной из такой систем станет суперкомпьютер Alps в Швейцарском национальном компьютерном центре (Swiss National Computing Centre, CSCS), который придёт на смену Piz Daint (12 место в нынешнем рейтинге TOP500). Этот суперкомпьютер серии HPE Cray EX, в частности, сможет в семь раз быстрее обучить модель GPT-3, чем машина NVIDIA Selene (5 место в TOP500). Впрочем, на нём будут выполняться и классические HPC-задачи в области метеорологии, физики, химии, биологии, экономики и так далее. Ввод в эксплуатацию намечен на 2023 год. Тогда же в США появится аналогичная машина от HPE в Лос-Аламосской национальной лаборатории (LANL). Она дополнит систему Crossroads, использующую исключительно процессоры Intel Xeon Sapphire Rapids.

Постоянный URL: http://servernews.ru/1037136
06.04.2021 [15:14], Владимир Мироненко

Серверные решения на базе Arm наращивают присутствие на рынке периферийных вычислений

Согласно недавнему отчёту Digitimes Research, Arm-архитектура расширяет своё присутствие на рынке серверов для периферийных вычислений, поскольку решения на этой платформе отличаются низким энергопотреблением и более доступной стоимостью.

Операторы облачных вычислений первого уровня и крупные вендоры, такие как Amazon, Huawei и Hewlett-Packard Enterprise (HPE), инвестировали в разработку чипов и систем на базе Arm, а сама Arm также начала продвигать проект Project Cassini, стремясь укрепить экосистему своей серверной платформы и расширить совместимость с периферийными решениями.

Supermicro SYS E403 9D 16C IPD2 — периферийный сервер для радиомачт

Supermicro SYS E403 9D 16C IPD2 — периферийный сервер для радиомачт

Как ожидается, Amazon станет основным клиентом решений для облачных вычислений на базе Arm. В дополнение к своим сервисам AWS Elastic Compute Cloud (EC2) на базе Arm, компания также планирует запустить к концу 2021 года гибридные облачные сервисы Outposts на базе Arm, которые будут ориентированы на бизнес периферийных вычислений на предприятиях.

Аналитики отметили, что в настоящее время решения на базе Arm занимают лишь ограниченную долю на рынке серверов и по-прежнему имеют проблемы, связанные с совместимостью с аппаратным и программным обеспечением серверов на базе x86. Поэтому экосистему Arm пока нельзя назвать всеобъемлющей.

Но, как прогнозирует Digitimes Research, Arm-решения будут постепенно проникать на рынок пограничных серверов, где в настоящее время доминирует архитектура x86, с большим количеством брендов серверов и операторов облачных вычислений, которые будут разрабатывать продукты на основе Arm.

Постоянный URL: http://servernews.ru/1036660
05.04.2021 [23:46], Владимир Мироненко

Новая версия VMware ESXi для Arm поддерживает Ampere Altra

В прошлом году VMware выпустила первую экспериментальную версию ESXi для Arm-процессоров. Следует отметить, что перенос ESXi на Arm является огромной технической задачей не только потому, что ESXi — большая кодовая база со множеством технических тонкостей, но и потому что семантика, лежащая в основе процессоров Arm, сильно отличается от архитектуры x86.

Как сообщили в VMware, это потребовало тщательного тестирования и доработки, чтобы гарантировать, что ESXi работает как на Arm, так и на x86-платформах, сохраняя при этом высокие стандарты ESXi. Тем не менее, работа на Arm-версией продолжается, и на днях компания представила очередной минорный релиз ESXi Arm Edition 1.3.

Обновление включает в себя несколько новых функций и компонентов, и требует новой установки. Как сообщила компания, обновление представляет собой оценочную программу, предназначенную для корпоративных архитекторов, которые рассматривают возможность виртуализации рабочих нагрузок на Arm, а также для команд разработчиков и тестировщиков, ищущих способ развернуть свои рабочие среды на Arm, и для профессионалов, которые просто хотят изучить возможности ESXi-Arm.

Основные особенности ESXi Arm fling v1.3:

  • Улучшенная совместимость оборудования (различные исправления ошибок и улучшения);
  • Добавлена экспериментальная поддержка процессоров Ampere Altra (только для систем с одним сокетом);
  • Поддержка ACPI для виртуальных машин;
  • Поддержка NVMe и PVSCSI Boot в vEFI;
  • Возможность обходного решения для загрузки ISO на некоторых серверах Arm;
  • Устранение сбоя VMM для новых гостевых ОС и систем на базе Neoverse N1;
  • Улучшенная виртуализация гостевого контроллера прерываний;
  • Улучшенная виртуализация PMU;
  • Улучшенная поддержка ВМ, использующих прямой порядок байтов (big endian).
Постоянный URL: http://servernews.ru/1036594
19.03.2021 [15:43], Сергей Карасёв

128-ядерные Arm-процессоры Ampere Altra Max будут в полтора раза быстрее предшественников

Ampere в текущем году собирается выпустить новые процессоры с архитектурой ARM, предназначенные для использования в серверах: изделия, получившие название Altra Max, обеспечат высокую производительность при относительно небольшом потреблении энергии.

Около года назад мы подробно рассказывали о первых чипах Ampere Altra. Напомним, что эти 7-нм изделия содержат 80 вычислительных ядер без поддержки многопоточности. При этом показатель TDP составляет 250 Вт при частоте 3,3 ГГц. Первые тесты показали, что в ряде задач Altra не хуже x86-64.

Число ядер в процессорах Ampere Altra Max увеличится до 128, то есть возрастёт ровно на 60 % по сравнению с предшественниками. При этом чипы будут по-прежнему производиться по 7-нм технологии. Важно отметить, что Ampere Altra Max будут совместимы на уровне сокета с Altra. Они также получат 128 линий PCIe 4.0 и восемь каналов оперативной памяти DDR4-3200.

Судя по обнародованной разработчикам информации, быстродействие по сравнению с Ampere Altra в зависимости от типа выполняемых задач поднимется на 51–57 % (при одинаковых тактовых частотах). Естественно, стоит ожидать, что выбор бенчмарков не является случайным. С другой стороны, Altra на звание HPC-чипов и не претендуют.

В дальнейшем Ampere намерена представить 5-нм процессоры серии Siryn. Однако соревноваться ей фактически не с кем: Marvell отказалась от развития ThunderX, Huawei находится под санкциями, а Qualcomm, поглотившая Nuvia, не намерена развивать серверное направление. Решения же вроде AWS Graviton2 и подобных ему не предназначены для использования вне облаков.

Постоянный URL: http://servernews.ru/1035283
17.03.2021 [22:59], Владимир Мироненко

AWS EC2 X2gd — новые ARM-инстансы с Graviton2 и увеличенным объёмом RAM

Облачный сервис AWS объявил о доступности EC2-инстансов X2gd. Новые инстансы на базе разработанных AWS ARM-процессоров Graviton2 обеспечивают до 55 % лучшее соотношение цены и производительности по сравнению с инстансами на базе архитектуры x86 текущего поколения Intel, а также предлагают увеличенный объем памяти на один vCPU по сравнению с другими инстансами на базе Graviton2.

Инстансы X2gd обеспечивают самую низкую стоимость гигабайта памяти среди всех инстансов Amazon EC2 и позволяют более эффективно выполнять такие рабочих нагрузок, как базы данных в памяти (например, Redis, Memcached и т. д.), реляционные базы данных (например, MySQL, PostGreSQL и т. д.), хранилища данных (например, Amazon Redshift), кеширование и автоматизация электронного проектирования (EDA).

Кроме того, по мере того, как все больше клиентов запускают контейнеры на AWS для обеспечения переносимости приложений и повышения эффективности инфраструктуры, экземпляры X2gd также позволяют им использовать контейнерные приложения с большим объёмом памяти в одном инстансе, чтобы снизить общую стоимость владения.

Инстансы Amazon EC2 на базе процессоров AWS Graviton2 начали предлагаться в мае 2020 года. Сейчас уже многие популярные решения AWS, включая Elastic Container Service, Elastic Container Registry, Elastic Kubernetes Service, CodeBuild, CodeCommit, CodePipeline, CodeDeploy, CloudWatch, ElastiCache и Elastic Map Reduce поддерживают Graviton2 для предоставления клиентам услуг с улучшенным соотношения цены к производительности.

X2gd присоединяются к растущему портфелю EC2-инстансов на базе AWS Graviton2: M6g/M6gd, C6g/C6gd/C6gn, R6g/R6gd и T4g. Инстансы X2gd доступны для повременной оплаты, с тарифом Savings Plans, как зарезервированные (RI) или как спотовые инстансы (SI). Экземпляры X2gd первоначально доступны в регионах США (Северная Вирджиния, Огайо, Орегон) и Европы (Ирландия). Чуть позже в этом году они будут доступны и в других регионах.

Постоянный URL: http://servernews.ru/1035084
08.03.2021 [12:32], Сергей Карасёв

NXP выпустит процессор i.MX 9 для умных производств и машинного зрения

Компания NXP Semiconductors раскрыла предварительную информацию о чипах семейства i.MX 9. Эти изделия найдут применение в системах промышленной автоматизации, платформах для умных зданий, комплексах машинного зрения и пр.

Нужно сразу оговориться, что полностью технические характеристики процессоров пока не раскрываются. Известно, что они будут изготавливаться по технологии FinFET с нормами 16/12 нанометров.

Говорится об оптимизации, нацеленной на снижение энергопотребления. В частности, упомянута архитектура Energy Flex, которая сочетает в себе гетерогенную доменную обработку, средства проектирования и технологические процессы для максимизации производительности при небольшом потреблении энергии.

NXP уже называет потенциальные сферы использования новых процессоров. Это, в частности, одновременное распознавание нескольких объектов или лиц, определение жестов, распознавание голосовых команд на естественном языке, обнаружение аномалий для прогностического обслуживания промышленных систем и пр.

Увы, другие характеристики чипов пока не раскрываются. О сроках появления изделий на коммерческом рынке сведений на данный момент нет. 

Постоянный URL: http://servernews.ru/1034347
04.03.2021 [14:19], Владимир Мироненко

Equinix Metal предложит серверы со 128-ядерными ARM-процессорами Ampere Altra

Equinix планирует в ближайшее время предоставить своим клиентам системы на базе 128-ядерных серверных ARM-процессоров Ampere Altra в своём сервисе Equinix Metal, предлагающем аренду bare-metal серверов.

Захари Смит (Zachary Smith), управляющий директор Equinix Metal, сообщил ресурсу The Register, что до запуска серверов с процессорами Ampere Altra осталось около двух недель. Он добавил, что в настоящее время в bare-metal серверах сервиса используются процессоры Intel и AMD последнего поколения.

По словам Смита, технология Ampere подойдёт тем заказчикам, кто предпочитает изолировать рабочие нагрузки. «Стабильная одноядерная производительность на Arm сейчас просто супер, — отметил он. — Контейнерным рабочим нагрузкам это действительно подойдёт».

Захари Смит сообщил, что Equinix Metal предлагает интеграцию с платформой Mirantis Container Cloud и назвал ещё одного нового партнёра — компанию Cohesity, предлагающей платформу для управления и хранения больших массивов данных. Кроме того, Equinix Metal предлагает серверы Dell PowerEdge и обеспечивает размещение на своей платформе облачной системы хранения данных Pure Storage.

Equinix продолжает расширять географию Equinix Metal. Сейчас сервис предлагается на 18 рынках, хотя лишь на восьми он предоставляется в виде «on-demand node» (узел по запросу). На остальных 10 территориях, по словам Смита, Equinix Metal является альтернативой колокации, обеспечивающей более быстрое время запуска, чем размещение собственного оборудования в ЦОД Equinix.

Постоянный URL: http://servernews.ru/1034117
02.03.2021 [13:59], Сергей Карасёв

ARM-чипы усиливают позиции в ЦОД и HPC и способны занять до 10% серверного рынка

Компания ARM, известный разработчик энергоэффективных чипов для мобильных устройств, укрепляет позиции на рынке процессоров для центров обработки данных и систем высокопроизводительных вычислений (НРС). Об этом говорит анализ рынка, проведённый специалистами Digitimes Research.

Серверы на базе ARM привлекают операторов крупных дата-центров и облачных платформ по двум основным причинам. Это меньшие стоимость и энергопотребление по сравнению с решениями, имеющими архитектуру х86.

Иллюстрации ARM

Иллюстрации ARM

На фоне пандемии наблюдается быстрый рост спроса на всевозможные облачные услуги. Кроме того, интенсивно развиваются платформы искусственного интеллекта и машинного обучения. В этой ситуации компании вроде Amazon и Microsoft вынуждены наращивать парк серверов. Выбор изделий на базе ARM обеспечивает высокое соотношение цены/производительности и одновременно предоставляет гибкие возможности в плане конфигурирования систем.

По мнению аналитиков, в обозримом будущем чипы с архитектурой ARM могут занять до 10 % рынка серверных процессоров. В качестве сдерживающих факторов называются слабо развитая экосистема программного обеспечения, отсутствие широкого выбора материнских плат и подходящих серверных корпусов.

Постоянный URL: http://servernews.ru/1033894
01.03.2021 [12:52], Сергей Карасёв

1U-сервер SolidRun HoneyComb LX2: два узла с 16 ядрами ARM Cortex A72

Компания SolidRun анонсировала сервер HoneyComb LX2, рассчитанный на монтаж в стойку. В корпусе типоразмера 1U размещены два узла, каждый из которых содержит энергоэффективный процессор на архитектуре ARM.

В частности, задействован чип NXP Layerscape LX2160A. Это изделие объединяет 16 вычислительных ядер ARM Cortex A72, функционирующих на тактовой частоте до 2,0 ГГц. Каждый из узлов на основе материнской платы типоразмера Mini-ITX может использовать до 64 Гбайт оперативной памяти DDR4.

Предусмотрены флеш-модуль eMMC вместимостью 64 Гбайт и слот для карты microSD. Для подключения накопителей доступны четыре порта SATA 3.0 с пропускной способностью до 6 Гбит/с. Узлы располагают одним слотом расширения PCIe 3.0 x8 и коннектором M.2 для подключения твердотельного модуля NVMe. Есть два порта USB 3.0 для подключения внешних устройств.

Новинка предлагает неплохие возможности в плане сетевых подключений. Так, каждый из узлов оборудован четырьмя портами 10GbE SFP+. Кроме того, доступен один сетевой порт RJ45 с пропускной способностью 1 Гбит/с. Питание обеспечивает БП мощностью 300 Вт (для каждого из узлов).

Постоянный URL: http://servernews.ru/1033787
Система Orphus