Материалы по тегу: hpc

07.04.2022 [15:02], Владимир Мироненко

Fujitsu Computing as a Service — публичное облако для HPC, ИИ и квантовых симуляций на базе Arm-процессоров A64FX

Fujitsu объявила о запуске набора сервисов Fujitsu Computing as a Service (CaaS, вычисления как услуга) для ускорения цифровой трансформации и расширения возможностей клиентов, в рамках которого предлагается облачный доступ к ряду передовых вычислительных решений для коммерческого использования.

Новая услуга, в частности, будет включать доступ к квантовому симулятору Fujitsu Digital Annealer, к сервису Fujitsu Cloud Service HPC, а также к программным решениям для ИИ и машинного обучения. Fujitsu начнёт предоставлять новые услуги в Японии с октября 2022 года. Впоследствии они станут доступны в других регионах, включая Европу, Азиатско-Тихоокеанский регион и Америку.

 Изображения: Fujitsu

Изображения: Fujitsu

Компания начала приём предварительных заказов на облачный сервис Fujitsu Cloud Service HPC. Он использует узлы PRIMEHPC FX1000 на базе Arm-процессоров Fujitsu A64FX (48 ядер + 32 Гбайт HBM2 с ПСП 1 Тбайт/с), которые лежат в основе самого быстрого в мире суперкомпьютера Fugaku. PRIMEHPC FX1000 позволяет объединить до 384 узлов с помощью проприетарного интерконнекта Tofu D. В ближайшие месяцы Fujitsu добавит доступ к Digital Annealer и облачным ИИ-сервисам.

По словам Вивека Махаджана (Vivek Mahajan), технического директора Fujitsu Limited, CaaS предоставит клиентам беспрепятственный доступ к сервисам в публичном облаке для удовлетворения быстро растущих вычислительных потребностей, используя передовые вычислительные технологии Fujitsu. В будущем компания планирует ещё больше расширить портфолио за счёт доступа к таким технологиям, как квантовые вычисления.

Fujitsu ожидает, что CaaS будет способствовать решению социальных проблем и целого ряда задач в широком спектре отраслей, включая финансы, производство, дистрибуцию, логистику, предотвращение стихийных бедствий (включая прогнозирование землетрясений и цунами), биологию и медицину (разработка лекарств и генная терапия). Новая платформа войдёт в состав Fujitsu UVANCE.

Постоянный URL: http://servernews.ru/1063529
30.03.2022 [22:01], Владимир Мироненко

Российская суперкомпьютерная платформа «РСК Торнадо» объединила отечественные «Эльбрусы» и зарубежные x86-процессоры

Группа компаний РСК на конференции «Параллельные вычислительные технологии (ПаВТ) 2022» сообщила о создании суперкомпьютерной платформы «РСК Торнадо», которая позволяет одновременно использовать в одной системе вычислительные узлы на базе зарубежных x86-процессоров и отечественных чипов «Эльбрус».

Возможность использования различных типов микропроцессорных архитектур в одном монтажном шкафу (до 104 серверов в стойке), позволит ускорить темпы импортозамещения в области высокопроизводительных вычислительных систем (HPC), решений для центров обработки данных (ЦОД) и систем хранения данных (СХД). Унифицированная интероперабельная (т.е. обеспечивающая функциональную совместимость разных решений) платформа «РСК Торнадо» предназначена для решения широкого круга задач, в том числе для работы с нагрузками Big Data, HPC и ИИ.

 Суперкомпьютер «Говорун» в ОИЯИ (Фото: Группа компаний РСК)

Суперкомпьютер «Говорун» в ОИЯИ (Фото: Группа компаний РСК)

Разработка и создание вычислительных систем на основе «РСК Торнадо» осуществляется на территории России в рамках соглашения с Министерством промышленности и торговли Российской Федерации с целью реализации подпрограммы «Развитие производства вычислительной техники» в составе государственной программы «Развитие электронной и радиоэлектронной промышленности».

Программный стек «РСК БазИС» для вышеупомянутой платформы тоже разработан в России. В настоящее время система «РСК БазИС» используется для оркестрации вычислительных мощностей Межведомственного суперкомпьютерного центра (МСЦ) РАН, Санкт-Петербургского политехнического университета (СПбПУ) и Объединенного института ядерных исследований (ОИЯИ), сведённых в единую инфраструктуру для оптимизации вычислительных ресурсов.

Постоянный URL: http://servernews.ru/1063096
29.03.2022 [21:00], Владимир Мироненко

Общая производительность 50-ти самых мощных суперкомпьютеров России выросла за полгода почти вчетверо

Сегодня Научно-исследовательский вычислительный центр МГУ имени М.В.Ломоносова и Межведомственный Суперкомпьютерный Центр РАН объявили в ходе Международной научной конференции «Параллельные вычислительные технологии (ПаВТ) 2022» о выпуске тридцать шестой редакции списка Тор50 самых мощных суперкомпьютеров России. Первые три места принадлежат системам «Яндекса»: «Червоненкис», «Галушкин», «Ляпунов».

Новая редакция списка отличается существенным ростом суммарной производительности в тесте Linpack — всего за полгода она увеличилась с 22,9 до 85,1 Плофпс. Суммарная пиковая производительность выросла с 35,2 до до 120,2 Пфлопс. За этот короткий период в списке появилось сразу семь новых суперкомпьютеров, четыре из которых заняли первые места, а также произошло обновление ещё одной системы.

 Источник: top50.supercomputers.ru

Источник: top50.supercomputers.ru

среди отечественных производителей в рейтинге Top50 по количеству систем снова лидирует РСК — 11 вычислительных комплексов, все эксклюзивной разработки. Среди иностранных — HPE, за которой в списке числятся 12 машин. В тройку лидеров также входит компания «Т-Платформы», у неё 8 комплексов в списке. Количество систем, используемых в науке и образовании, сократилось с 27 до 26, на конкретные прикладные исследования по-прежнему ориентировано 7 систем.

42 системы используют процессоры Intel. Число гибридных суперкомпьютеров, включающих ускорители, выросло за полгода с 27 до 32. Интерконнект InfiniBand применяется в 34 системах (ранее таковых было 33). Также сохранилось количество систем на основе технологии Intel Omni-Path — 5. Наконец, 7 суперкомпьютеров всё ещё используют для взаимодействия узлов сеть Gigabit Ethernet.

Постоянный URL: http://servernews.ru/1062985
25.03.2022 [14:03], Сергей Карасёв

Объём мирового рынка высокопроизводительных вычислений приблизился к $35 млрд

Компания Hyperion Research обнародовала результаты исследования глобальной отрасли высокопроизводительных вычислений (HPC). По итогам прошлого года рынок показал довольно существенный рост — +13,8 % в денежном выражении по отношению к 2020-му. Данные Hyperion Research учитывают затраты в сегментах облачных платформ и локальных вычислительных систем.

В 2020 году расходы в обозначенной сфере составили приблизительно $30,6 млрд. В прошлом году этот показатель увеличился до $34,8 млрд. Если рассматривать сферу локальных высокопроизводительных вычислений с учётом серверов, систем хранения данных, программного обеспечения и сопутствующих сервисов, то затраты здесь достигли $29,7 млрд. В сегменте публичных облаков рост зафиксирован на уровне 18,6 %. Затраты здесь выросли до $5,1 млрд по итогам прошлого года.

 Источник изображения: pixabay.com / Schäferle

Источник изображения: pixabay.com / Schäferle

В сегменте локальных HPC-систем поставки в годовом исчислении поднялись на 9,1 %. Итоговый результат — приблизительно $14,8 млрд, из которых $6,9 млрд пришлось на суперкомпьютеры. В течение прошлого года было реализовано около 4,3 млн CPU для систем высокопроизводительных вычислений и 291 тыс. ускорителей. Рост поставок последних по сравнению с 2020-м составил внушительные 44,1 %.

Аналитики Hyperion Research отмечают, что HPC-рынок смог неплохо справиться с проблема в цепочках поставок. Рост рынка во много обеспечивается появлением новых технологий, а также расширением сферы использования HPC-систем, которая теперь, в частности, включает ИИ, машинное обучение, Big Data и т.д.

Постоянный URL: http://servernews.ru/1062728
23.03.2022 [15:54], Сергей Карасёв

Inventec выпустила 2U4N-сервер Solrock на базе Intel Xeon Ice Lake-SP

Компания Inventec анонсировала стоечный сервер под названием Solrock. Эта система, построенная на аппаратной платформе Intel, подходит для решения ИИ-задач, построения платформ высокопроизводительных вычислений, машинного обучения и пр. Новинка выполнена в форм-факторе 2U.

 Источник изображений: Inventec

Источник изображений: Inventec

Конструкция решения включает четыре узла, каждый из которых может быть укомплектован двумя процессорами Xeon Scalable третьего поколения с величиной TDP до 165 Вт. Поддерживается до 4 Тбайт оперативной памяти DDR4-3200 в конфигурации 16 × 256 Гбайт. Узлы снабжены восемью портами SATA 3.0, слотами PCIe Gen4 x16 OCP 3.0 NIC и PCIe Gen4 x16 (низкопрофильная карта), выделенным сетевым портом управления GbE.

Габариты Solrock составляют 447,0 × 87,0 × 866,0 мм. Сервер доступен в конфигурациях с поддержкой восьми накопителей LFF SATA и двенадцати накопителей SFF NVMe. Установлены два блока питания с сертификатом Platinum мощностью 2400 Вт. В системе задействовано воздушное охлаждение.

Постоянный URL: http://servernews.ru/1062574
22.03.2022 [18:57], Сергей Карасёв

NVIDIA представила OVX: суперкомпьютер для начинающих

Компания NVIDIA анонсировала специализированную систему под названием OVX, предназначенную для построения крупномасштабных цифровых двойников — виртуальных копий сложных физических объектов. Это могут быть целые предприятия, здания, города и пр.

Решение OVX рассчитано на работу с Omniverse — открытой расширяемой платформой для совместной работы в виртуальной среде и физически корректного моделирования в реальном времени. Omniverse трансформирует рабочие процессы в тех областях, где фотореалистичный и физически корректный рендеринг с трассировкой лучей необходим для иммерсивной визуализации, точного моделирования и быстрой оценки проектов.

 Источник изображения: NVIDIA

Источник изображения: NVIDIA

В частности, сервер OVX Pod содержит восемь ускорителей NVIDIA A40, три 200G-адаптера NVIDIA ConnectX-6 Dx, 1 Тбайт оперативной памяти и NVMe-хранилище суммарной вместимостью 16 Тбайт. Система OVX может масштабироваться от конфигурации Pod с восемью серверами до SuperPOD с 32 серверами для решения сложных задач.

Постоянный URL: http://servernews.ru/1062490
22.03.2022 [18:40], Игорь Осколков

NVIDIA анонсировала 4-нм ускорители Hopper H100 и самый быстрый в мире ИИ-суперкомпьютер EOS на базе DGX H100

На GTC 2022 компания NVIDIA анонсировала ускорители H100 на базе новой архитектуры Hopper. Однако NVIDIA уже давно говорит о себе как создателе платформ, а не отдельных устройств, так что вместе с H100 были представлены серверные Arm-процессоры Grace, в том числе гибридные, а также сетевые решения и обновления наборов ПО.

 NVIDIA H100 (Изображения: NVIDIA)

NVIDIA H100 (Изображения: NVIDIA)

NVIDIA H100 использует мультичиповую 2.5D-компоновку CoWoS и содержит порядка 80 млрд транзисторов. Но нет, это не самый крупный чип компании на сегодняшний день. Кристаллы новинки изготавливаются по техпроцессу TSMC N4, а сопровождают их — впервые в мире, по словам NVIDIA — сборки памяти HBM3 суммарным объёмом 80 Гбайт. Объём памяти по сравнению с A100 не вырос, зато в полтора раза увеличилась её скорость — до рекордных 3 Тбайт/с.

 NVIDIA H100 (SXM)

NVIDIA H100 (SXM)

Подробности об архитектуре Hopper будут представлены чуть позже. Пока что NVIDIA поделилась некоторыми сведениями об особенностях новых чипов. Помимо прироста производительности от трёх (для FP64/FP16/TF32) до шести (FP8) раз в сравнении с A100 в Hopper появилась поддержка формата FP8 и движок Transformer Engine. Именно они важны для достижения высокой производительности, поскольку само по себе четвёртое поколение ядер Tensor Core стало втрое быстрее предыдущего (на всех форматах).

 NVIDIA H100 CNX (PCIe)

NVIDIA H100 CNX (PCIe)

TF32 останется форматом по умолчанию при работе с TensorFlow и PyTorch, но для ускорения тренировки ИИ-моделей NVIDIA предлагает использовать смешанные FP8/FP16-вычисления, с которыми Tensor-ядра справляются эффективно. Хитрость в том, что Transformer Engine на основе эвристик позволяет динамически переключаться между ними при работе, например, с каждым отдельным слоем сети, позволяя таким образом добиться повышения скорости обучения без ущерба для итогового качества модели.

На больших моделях, а именно для таких H100 и создавалась, сочетание Transformer Engine с другими особенностями ускорителей (память и интерконнект) позволяет получить девятикратный прирост в скорости обучения по сравнению с A100. Но Transformer Engine может быть полезен и для инференса — готовые FP8-модели не придётся самостоятельно конвертировать в INT8, движок это сделает на лету, что позволяет повысить пропускную способность от 16 до 30 раз (в зависимости от желаемого уровня задержки).

Другое любопытное нововведение — специальные DPX-инструкции для динамического программирования, которые позволят ускорить выполнение некоторых алгоритмов до 40 раз в задачах, связанных с поиском пути, геномикой, квантовыми системами и при работе с большими объёмами данных. Кроме того, H100 получили дальнейшее развитие виртуализации. В новых ускорителях всё так же поддерживается MIG на 7 инстансов, но уже второго поколения, которое привнесло больший уровень изоляции благодаря IO-виртуализации, выделенным видеоблокам и т.д.

Так что MIG становится ещё более предпочтительным вариантом для облачных развёртываний. Непосредственно к MIG примыкает и технология конфиденциальных вычислений, которая по словам компании впервые стала доступна не только на CPU. Программно-аппаратное решение позволяет создавать изолированные ВМ, к которым нет доступа у ОС, гипервизора и других ВМ. Поддерживается сквозное шифрование при передаче данных от CPU к ускорителю и обратно, а также между ускорителями.

Память внутри GPU также может быть изолирована, а сам ускоритель оснащается неким аппаратным брандмауэром, который отслеживает трафик на шинах и блокирует несанкционированный доступ даже при наличии у злоумышленника физического доступа к машине. Это опять-таки позволит без опаски использовать H100 в облаке или в рамках колокейшн-размещения для обработки чувствительных данных, в том числе для задач федеративного обучения.


NVIDIA HGX H100

Но главная инновация — это существенное развитие интерконнекта по всем фронтам. Суммарная пропускная способность внешних интерфейсов чипа H100 составляет 4,9 Тбайт/с. Да, у H100 появилась поддержка PCIe 5.0, тоже впервые в мире, как утверждает NVIDIA. Однако ускорители получили не только новую шину NVLink 4.0, которая стала в полтора раза быстрее (900 Гбайт/с), но и совершенно новый коммутатор NVSwitch, который позволяет напрямую объединить между собой до 256 ускорителей! Пропускная способность «умной» фабрики составляет до 70,4 Тбайт/с.

Сама NVIDIA предлагает как новые системы DGX H100 (8 × H100, 2 × BlueField-3, 8 × ConnectX-7), так и SuperPOD-сборку из 32-х DGX, как раз с использованием NVLink и NVSwitch. Партнёры предложат HGX-платформы на 4 или 8 ускорителей. Для дальнейшего масштабирования SuperPOD и связи с внешним миром используются 400G-коммутаторы Quantum-2 (InfiniBand NDR). Сейчас NVIDIA занимается созданием своего следующего суперкомпьютера EOS, который будет состоять из 576 DGX H100 и получит FP64-производительность на уровне 275 Пфлопс, а FP16 — 9 Эфлопс.

Компания надеется, что EOS станет самой быстрой ИИ-машиной в мире. Появится она чуть позже, как и сами ускорители, выход которых запланирован на III квартал 2022 года. NVIDIA представит сразу три версии. Две из них стандартные, в форм-факторах SXM4 (700 Вт) и PCIe-карты (350 Вт). А вот третья — это конвергентный ускоритель H100 CNX со встроенными DPU Connect-X7 класса 400G (подключение PCIe 5.0 к самому ускорителю) и интерфейсом PCIe 4.0 для хоста. Компанию ей составят 400G/800G-коммутаторы Spectrum-4.

Постоянный URL: http://servernews.ru/1062434
15.03.2022 [15:45], Сергей Карасёв

Atos построила суперкомпьютер Levante для моделирования климата: 3000 узлов с AMD EPYC, 800 Тбайт памяти и 130 Пбайт СХД

Французская компания Atos и Климатический вычислительный центр Германии (DKRZ) объявили о начале эксплуатации нового комплекса высокопроизводительных вычислений (HPC) — суперкомпьютера под названием Levante. Система смонтирована на площадке DKRZ в Гамбурге.

В основу Levante положен кластер Atos BullSequana XH2000. В рамках первой фазы строительства объединены около 3000 узлов на процессорах AMD EPYC 7763. В качестве интерконнекта используется NVIDIA Mellanox InfiniBand HDR 200G. Суперкомпьютер имеет 800 Тбайт основной памяти. Файловая система Lustre обеспечивает ёмкость в 130 Пбайт. Это одна из крупнейших машин подобного класса в Европе.

 Источник изображения: DKRZ

Источник изображения: DKRZ

В текущем виде комплекс демонстрирует пиковую производительность на уровне 16 Пфлопс. Это в полтора раза больше, чем результат полученный к моменту выхода ноябрьского рейтинге TOP500, в котором система заняла 68-е место. В нынешнем виде она заняла бы примерно 36–37 место.

По сравнению с суперкомпьютером предыдущего поколения Mistral комплекс Levante не только обеспечивает многократный прирост производительности, но и позволяет снизить стоимость владения. Достигается это за счёт применения технологии прямого жидкостного охлаждения. Использовать Levante планируется для моделирования различных природных явлений и прогнозирования изменений климата.

Постоянный URL: http://servernews.ru/1062005
15.03.2022 [14:54], Сергей Карасёв

Суперкомпьютер РАН помог в создании «цифровых лекарств» от коронавируса

Высокопроизводительный вычислительный комплекс Российской академии наук (РАН), построенный компаний РСК, помог в разработке нового метода более быстрого моделирования молекул-аптамеров для борьбы с коронавирусом SARS-CoV-2. Об этом говорится в публикации журнала Chemistry Europe.

Аптамеры — молекулы, которые способны находить заданные клетки организма и воздействовать на них. Использование аптамеров в терапевтической практике называют «цифровым лекарством» — благодаря целевому действию препарата, который способен предотвращать связывание вируса с клетками человека.

 Фото: Группа компаний РСК

Фото: Группа компаний РСК

Вычислительные мощности Межведомственного суперкомпьютерного центра РАН (МСЦ РАН) использовались в ходе двухгодичного исследования, проводимого в рамках международного проекта The Good Hope Net («Сеть доброй надежды»). С помощью новой итеративной процедуры проектирования были получены высокоспецифичные аптамеры к рецептор-связывающему домену шиповидного белка SARS-CoV-2. В общей сложности специалисты смоделировали 256 аптамеров, из которых для дальнейших исследований отобраны восемь.

Отмечается, что для ускорения разработки учёные применили подход, который сочетает молекулярную динамику с квантовой химией. В частности, были задействованы молекулярный дизайн, трёхмерное молекулярное моделирование мишени, стыковка аптамера с белком, молекулярно-динамическое моделирование комплексов, квантово-механическая оценка взаимодействия между аптамером и мишенью и экспериментальная проверка в каждом цикле.

«Достоинством такого подхода является то, что он значительно увеличивает скорость разработки аптамеров "с нуля", так как для исследования не требуется нарабатывать большое количество вирусных белков, достаточно создать их трёхмерную модель», — говорится в публикации.

Постоянный URL: http://servernews.ru/1062003
08.03.2022 [00:28], Владимир Мироненко

NVIDIA приобрела разработчика блочных SDS Excelero

NVIDIA сообщила о приобретении израильской компании Excelero, разработчика высокопроизводительных блочных систем хранения данных (СХД). Условия сделки не разглашаются. Excelero продолжит интегрировать свои технологии в стек корпоративного ПО NVIDIA, а её команда присоединится к израильскому подразделению «зелёных», где работет около 2800 сотрудников.

NVMesh от Excelero предлагает программно определяемое блочное хранилище с использованием подключенных по сети NVMe SSD, которое функционирует локально и/или облаке. За прошедшие годы Excelero получила на развитие $35 млн, включая инвестиции от Western Digital и Mellanox (ныне NVIDIA Networking). Продукты Excelero будут использоваться, в том числе, для HPC-решений NVIDIA с поддержкой DPU BlueField и RDMA.

 Источник: NVIDIA

Источник: NVIDIA

Нынешние продукты компании будут поддерживаться до завершения контрактов с заказчиками, но впоследствии бренд Excelero исчезнет. «NVIDIA явно создает набор основных компетенций на системном уровне благодаря своим приобретениям и новым продуктам, — прокомментировал приобретение NVIDIA Эрл Джозеф (Earl Joseph), генеральный директор Hyperion Research. Всего пару месяцев назад NVIDIA приобрела компанию по управлению кластерами высокопроизводительных вычислений Bright Computing.

Постоянный URL: http://servernews.ru/1061509
Система Orphus