Материалы по тегу: hpc

02.03.2021 [15:43], Сергей Карасёв

ASRock Rack MEC2U-EP2C621D16/4LP: HPC-сервер на базе Intel Xeon Scalable

Компания ASRock Rack анонсировала стоечный сервер MEC2U-EP2C621D16/4LP, предназначенный для использования в составе платформ высокопроизводительных вычислений (НРС). В основу новинки положена аппаратная платформа Intel.

Допускается установка двух процессоров Intel Xeon Scalable второго поколения в исполнении LGA3647 (Socket P) с показателем TDP до 205 Вт. Для модулей оперативной памяти DDR4-2933 доступны в общей сложности 16 слотов, а максимально допустимый объём ОЗУ составляет 2 Тбайт.

Во фронтальной части предусмотрены шесть отсеков для 2,5-дюймовых накопителей SAS/SATA/NVMe с возможностью «горячей» замены. Кроме того, можно установить два твердотельных модуля M.2.

Для карт расширения есть пять слотов PCIe 3.0 x16 и один разъём PCIe 3.0 x8. Сервер имеет формат 2U с габаритами 456 × 446 × 87 мм. Подсистема питания выполнена на основе двух блоков мощностью 800 Вт с сертификацией 80 PLUS Platinum.

Доступны четыре сетевых порта 1GbE, а также выделенный сетевой порт управления на базе контроллера Realtek RTL8211E. На фронтальной панели расположены четыре разъёма USB 3.2 Gen1 Type-A, последовательный порт и аналоговый интерфейс D-Sub.

Постоянный URL: http://servernews.ru/1033909
02.03.2021 [15:39], Андрей Галадей

Codeplay и ряд НИИ работают над расширением использования компилятора LLVM SYCL для Nvidia A100

Национальный энергетический научно-исследовательский вычислительный центр (NERSC), Национальная лаборатория им. Лоуренса в Беркли (LBNL) и вычислительный центр Argonne Leadership Computing Facility (ALCF) совместно с Codeplay Software работают над расширением возможностей компилятора LLVM SYCL GPU для ускорителей NVIDIA A100.

aesin.org.uk

aesin.org.uk

Эта программа должна помочь разработчикам создавать высокопроизводительные приложения, которые можно переносить между архитектурами различных типов. Отметим, что британская компания Codeplay уже давно занимается разработкой компиляторов и инструментов для различных аппаратных архитектур. В числе её проектов — компиляторы SYCL, а также другие решения для платформы NVIDIA V100

SYCL — это открытый стандарт, поддерживаемый Khronos Group. Впервые его показали в 2014 году. Это открытый кроссплатформенный уровень абстракции, который позволяет писать код для гетерогенных процессоров. SYCL будет поддерживаться на грядущем экзафлопсном суперкомпьютере Aurora Министерства энергетики США.

Постоянный URL: http://servernews.ru/1033839
02.03.2021 [13:59], Сергей Карасёв

ARM-чипы усиливают позиции в ЦОД и HPC и способны занять до 10% серверного рынка

Компания ARM, известный разработчик энергоэффективных чипов для мобильных устройств, укрепляет позиции на рынке процессоров для центров обработки данных и систем высокопроизводительных вычислений (НРС). Об этом говорит анализ рынка, проведённый специалистами Digitimes Research.

Серверы на базе ARM привлекают операторов крупных дата-центров и облачных платформ по двум основным причинам. Это меньшие стоимость и энергопотребление по сравнению с решениями, имеющими архитектуру х86.

Иллюстрации ARM

Иллюстрации ARM

На фоне пандемии наблюдается быстрый рост спроса на всевозможные облачные услуги. Кроме того, интенсивно развиваются платформы искусственного интеллекта и машинного обучения. В этой ситуации компании вроде Amazon и Microsoft вынуждены наращивать парк серверов. Выбор изделий на базе ARM обеспечивает высокое соотношение цены/производительности и одновременно предоставляет гибкие возможности в плане конфигурирования систем.

По мнению аналитиков, в обозримом будущем чипы с архитектурой ARM могут занять до 10 % рынка серверных процессоров. В качестве сдерживающих факторов называются слабо развитая экосистема программного обеспечения, отсутствие широкого выбора материнских плат и подходящих серверных корпусов.

Постоянный URL: http://servernews.ru/1033894
26.02.2021 [18:55], Алексей Степин

Гибридный суперкомпьютер Wisteria получит ARM-процессоры Fujitsu A64FX, Intel Xeon Ice Lake и ускорители NVIDIA A100

Как известно, лидер всемирного рейтинга суперкомпьютеров, японский кластер Fugaku, имеет гомогенную архитектуру и полностью построен на процессорах Fujitsu A64FX, сочетающих архитектуру ARM v8 и фирменные векторные 512-битные расширения.

Такие системы проще в программировании, но это не значит, что процессоры Fujitsu не способны работать в комплексе с сопроцессорами иных архитектур и разработчиков. И новый японский суперкомпьютер Wisteria/BDEC-01 будет гетерогенным по своей природе.

Проект Wisteria — детище Токийского университета, создаваемое с целью поддержки проекта «Society 5.0». Не секрет, что Япония испытывает немало проблем, как экономических, так и социальных: старение общества, снижение численности трудоспособного населения, устаревшая инфраструктура и множество других, включая экологию. Для поиска решений и был создан вышеназванный проект, но лишь сейчас он получит серьёзную вычислительную поддержку.

Новый суперкомпьютер будет состоять из двух основных частей: симуляционной под названием Odyssey и кластера анализа данных, названного Aquarius. Эти названия были даны в честь командного и посадочного модулей лунного проекта «Аполлон 13». Пиковая производительность должна находиться в районе 33,1 Пфлопс на вычислениях двойной точности, при этом кластер Odyssey станет второй по производительности HPC-системой на базе ARM, уступая только Fugaku.

Кластер Odyssey будет состоять из 20 стоек Fujitsu PRIMEHPC FX1000, включающих в себя 7680 узлов на базе 48-ядерного процессора A64FX, дополненного 32 Гбайт памяти HBM2 (240 Тбайт совокупно). Для соединения узлов, как и в Fugaku, задействуется фирменная шина Tofu-D с пропускной способностью 13 Тбайт/с.

А вот кластер Aquarius имеет совсем другую архитектуру. Он получит 45 узлов на базе серверов Fujitsu PRIMERGY GX2570. Каждый узел располагает двумя процессорами Intel Xeon Ice Lake и восемью ускорителями NVIDIA A100; общий объём оперативной памяти составляет 36,5 Тбайт. Для соединения здесь используется сеть InfiniBand HDR 200 Гбит/с, а с кластером Odyssey связь будет осуществляться посредством InfiniBand EDR (100 Гбит/с).

С внешним миром Wisteria будет связана интерфейсами 25GbE с совокупной пропускной способностью 800 Гбит/с. Новый суперкомпьютер получит две подсистемы хранения данных на базе Fujitsu Exabyte File System (в основе файловая система Lustre). Быстрая NVMe-часть объёмом 1 Пбайт обеспечит скорость 1 Тбайт/с, а более медленная ограничится скоростью 500 Гбайт/с, зато её объём составит 25,8 Пбайт.

С точки зрения программной поддержки всё выглядит довольно обычно: говорится о поддержке стандартных HPC-решений и компиляторов, включая Fortran, C/C++ и Python, а также библиотек MPI. Однако архитектурно Wisteria уникальна, она включает в себя, как минимум, три архитектуры — ARM, x86-64 и NVIDIA Ampere, и ряд вопросов, касающихся программирования столь необычной системы, пока остаётся открытым.

Для новой системы разрабатывается специальная программная платформа h3-Open-BDEC (Hierarchical, Hybrid, Heterogeneous; Big Data and Extreme Computing), которая должна интегрировать задачи симуляции, анализа данных и машинного обучения в единое целое. На развитие этой платформы уже выделен правительственный грант в объёме 157 млн японских йен ($1,48 млн), рассчитанный на пять лет.

Первые пробные запуски Wisteria/BDEC-01 намечены на 14 мая 2021 года, а начало полномасштабной эксплуатации нового суперкомпьютера запланировано на октябрь. Это первый случай, когда для поиска решений социально-экономических и общественных проблем будет задействованы столь серьёзные вычислительные ресурсы.

Постоянный URL: http://servernews.ru/1033648
24.02.2021 [11:42], Владимир Мироненко

SiPearl и Open-Silicon Research будут совместно разрабатывать 6-нм ARM-чип для HPC

Компания SiPearl, разрабатывающая высокопроизводительный и энергоэффективный микропроцессор для европейского суперкомпьютера, и Open-Silicon Research, индийское подразделение OpenFive, ведущего поставщика кастомных кремниевых решений с различными IP, объявили о заключении многолетнего соглашения о сотрудничестве с целью разработки 6-нм ARM-чипа для высокопроизводительных вычислений (HPC) с использованием 2.5D-упаковки.

6-нм система на кристалле (SoC) SiPearl Rhea будет производиться компанией TSMC. OpenFive является давним партнёром TSMC в рамках программы Value Chain Aggregator (VCA). SoC нацелена на запуск приложений HPC, использующих искусственный интеллект (ИИ), таких как автономное вождение, распознавание лиц и геномика, которые генерируют огромные объёмы данных.

Чип Rhea представляет собой мощное, хорошо масштабируемое решение. Чип будет основан на 64 ядрах ARM с более чем 30 млрд транзисторов и построен по 6-нм техпроцессу TSMC. SiPearl уже имеет лицензию ARM на использование ядра Neoverse V1 под кодовым названием Zeus и будет применять его в Rhea.

В конструкции чипа также будут использоваться некоторые элементы RISC-V вместе с IP-блоками OSR High Bandwidth Memory (HBM2E), интерфейсом D2D и HBM-памятью в единой упаковке 2.5D. Как ожидается, новый чип поступит в продажу в четвёртом квартале 2022 года, так что ещё предстоит пройти долгий путь по его разработке и интеграции.

Следует отметить, что SiPearl активно участвует в европейских проектах по разработке микросхем для высокопроизводительных вычислений, таких как проект European Processor Initiative (EPI). Она также является членом консорциума Mont-Blanc 2020 по оснащению Европы специализированным модульным и энергоэффективным высокопроизводительным вычислительным микропроцессором и участником команды PlayFrance.Digital.

Постоянный URL: http://servernews.ru/1033362
22.02.2021 [22:19], Алексей Степин

Российский интерконнект Ангара-2: 200 Гбит/с при задержках до 0,8 мкс

Пять лет назад мы рассказывали о первом поколении российского интерконнекта Ангара или, если говорить более официально, межузловой высокоскоростной коммуникационной сети для суперкомпьютеров и кластеров. В рамках Elbrus Tech Day разработчики из НИЦЭВТ рассказали про второе поколение интерконнекта под названием Ангара-2, которое будет намного быстрее и эффективнее предыдущего.

В сравнении с первой версией были уменьшены задержки — они составляют менее 0,8 мкс, что ниже, нежели у нынешних InfiniBand FDR/EDR/HDR и Intel OmniPath. Снизилась и задержка на сетевой хоп. Скорость соединения выросла до 200 Гбит/с (в планах 400 Гбит/с), появилась поддержка топологий сети вплоть до 6D-тора.

Как и прежде, развитая поддержка RDMA позволяет в рамках сети эффективно строить гибридные системы, включающие в себя узлы на базе архитектур x86, Эльбрус и ARM, а также различные ускорители, в том числе, на базе ПЛИС. Кроме того, создатели работают и над поддержкой NVMe-oF. А в Ангара-2 также появится полноценная поддержка SR-IOV.

Для сети Ангара разработан собственный программный стек, ориентированный, в первую очередь, на высокопроизводительные вычисления. Как и в случае Intel DPDK, есть возможность общения приложений непосредственно с адаптером, минуя стандартные механизмы ядра Linux, за счёт чего и достигается низкий уровень задержек MPI. В Ангара-2 появится более широкий набор поддерживаемых типов сообщений, что упростит создание распределённых СХД на её основе.

Но может Ангара работать и с TCP/IP — совсем недавно разработчики представили вторую версию стека, обеспечивающего функциональность IP-over-Angara. Этот вариант не столь производителен, зато обеспечивает совместимость с существующими IP-решениями, позволяя задействовать RDMA для, к примеру, кластерных ФС.

Решения второго поколения должны появиться к концу текущего года. Контроллер Ангара-2 получит 32 линии PCIe 4.0, причём будет возможность мультихостового подключения — одна карта сможет обслуживать сразу несколько узлов. Адаптеры будут выпущены как в формате полноразмерных карт расширения с шестью портами QSFP-DD для безкоммутаторной топологии, так и в виде низкопрофильных плат с двумя портами для работы с коммутатором.

В первом случае возможно объединить до 1024 узлов в 3D-тор, во втором же использование 40-портовых коммутаторов позволит связать 20480 узлов в сеть с топологией 4D-тор. Под заказ НИЦЭВТ готов создать кастомные варианты с поддержкой 6D-тора и скоростями до 400 Гбит/с на порт.

Первое поколение Ангары уже давно используется в составе различных кластеров, в том числе с современными AMD EPYC Rome. Оно же будет актуально и для новых российских процессоров Эльбрус, так как в прошлом поколении, по словам представителя НИЦЭВТ, скорость работы фактически упирается в южный мост КПИ-2, который имеет только линии PCIe 2.0 x16 и x4.

Постоянный URL: http://servernews.ru/1033236
22.02.2021 [16:56], Сергей Карасёв

Введён в строй самый мощный в Африке суперкомпьютер Toubkal

Политехнический университет Мухаммеда VI бен аль-Хасана (UM6P) в Рабате (Марокко) официально объявил об открытии центра обработки данных уровня Tier III, который стал пристанищем для самого мощного в Африке комплекса высокопроизводительных вычислений. Новый суперкомпьютер получил имя Тубкал (Toubkal) в честь самого высокого пика Атласских гор.

В его основу положены серверы Dell Poweredge C6420, которые оснащены процессорами Intel Xeon Platinum 8276L. Эти чипы содержат 28 вычислительных ядер с возможностью одновременной обработки до 56 потоков инструкций. Номинальная тактовая частота составляет 2,2 ГГц, максимальная — 4,0 ГГц. В составе комплекса используются интерконнект Mellanox Infiniband HDR100. Ёмкость хранилища составлят более 8 Пбайт.

Заявленное быстродействие Toubkal находится на уровне 3,15 Пфлопс, а пиковое — около 5 Пфлопс. Суперкомпьютер успел «засветиться» в последнем рейтинге TOP500, где он занял 98 место. А в актуальном рейтинге TOP50 самых производительных суперкомпьютеров СНГ он бы смог занять третье место.

Система Toubkal смонтирована в новом Африканском суперкомпьютерном центре (ASCC). Инициативу по созданию комплекса поддержал Кембриджский университет (Великобритания). Ожидается, что суперкомпьютер будет использоваться для решения задач, связанных с искусственным интеллектом, Интернетом вещей, аналитикой данных, геномными исследованиями и пр.

Постоянный URL: http://servernews.ru/1033232
19.02.2021 [15:15], Сергей Карасёв

Мощь и компактность: HGX-сервер GIGABYTE G262-ZR0 имеет высоту всего 2U

Компания GIGABYTE Technology представила сервер G262-ZR0, предназначенный для решения задач в области ИИ и аналитики данных, а также для построения систем высокопроизводительных вычислений. Новинка использует платформу NVIDIA HGX A100 4-GPU, объединяющую графические ускорители NVIDIA A100, которые связаны высокоскоростным интерфейсом NVLink.

Общая вычислительная нагрузка возложена на два процессора AMD EPYC 7002 (плата MZ62-HD5), каждый из которых может содержать до 64 ядер. Для модулей оперативной памяти доступны 16 слотов: в системе можно задействовать до 4 Тбайт ОЗУ типа DDR4-3200. Предусмотрена возможность установки четырёх 2,5-дюймовых накопителей U.2 NVMe или SATA, а также двух твердотельных модулей M.2 посредством райзер-карты.

Ещё один слот M.2 есть на материнской плате. Также есть один мезонин OCP 3.0 PCI 4.0 x16 и два слота PCI 4.0 x16 во фронтальной части. Все они берует линии непосредственно у процессоров. Ещё четыре слота PCI 4.0 x16 в задней части подключены посредством коммутаторов Broadcom PEX88096. Все слоты рассчитаны на низкопрофильные карты расширения.

Присутствуют два сетевых порта 1GbE LAN на базе контроллера Intel I350-AM2, а также выделенный сетевой порт управления для BMC Aspeed AST2500. Питание обеспечивают два блока с сертификацией 80 PLUS Platinum мощностью 3000 Вт каждый.

На фронтальную панель, помимо гнёзд для сетевых кабелей, выведены два разъёма USB 3.0, а также интерфейс mini-DP. Сервер выполнен в формате 2‎U с габаритами 448 × 86,4 × 760 мм. Подробные характеристики новинки доступны здесь.

Постоянный URL: http://servernews.ru/1033027
16.02.2021 [11:20], Владимир Мироненко

Метеобюро Великобритании может разместить часть суперкомпьютерной системы за рубежом

В британских СМИ появились сообщения о том, что Метеорологическое бюро Великобритании рассматривает возможность размещения за границей по крайней мере части нового суперкомпьютера. В прошлом году оно объявило о выделении £1,2 млрд ($1,56 млрд) на создание самого мощного в мире суперкомпьютера, предназначенного для работы с погодой и климатом. Первый этап проекта должен начаться в 2022 году, а второй этап, стартующий в 2028 году, предполагает увеличение системы в три раза.

Газета The Mail on Sunday утверждает, что высокие требования к мощности новой системы высокопроизводительных вычислений (HPC) могут означать, что официальные лица рассматривают северную Европу в качестве возможного варианта размещения части системы: «Объём электроэнергии, которую будет использовать этот суперкомпьютер, будет настолько вели, что они захотят разместить половину системы, например, где-нибудь, в Норвегии, где у них будет более чистая энергия».

«Большинство наших экспертов и учёных по-прежнему находятся в Великобритании — с современными технологиями суперкомпьютеры не обязательно должны располагаться в одном здании», — сообщил The Mail on Sunday представитель Метеорологического бюро. Он добавил, что результаты тендеров пока неизвестны, и лишь после их оглашения будет ясно, каким будет решение.

Согласно документу на поставку продукции Метеорологического бюро, требуется, чтобы «не менее 50 %» мощности новой системы располагалось в Соединённом Королевстве, чтобы «защищать основные общественные интересы». Также в нём указано, что «остальная часть может быть расположена за пределами Великобритании, при условии, что участник торгов сможет убедить Метеорологическое бюро в том, что правовое поле среды, в которой находится объект, не представляет риска для доступности услуг».

Нынешняя суперкомпьютерная система Метеорологического бюро состоит из трёх суперкомпьютеров Cray XC40 с производительностью 14 Пфлопс. Это одна из самых быстрых систем в мире из числа предназначенных для моделирования погоды и климата, и она входила в топ-20 списка Top500 на момент установки в 2016 году. Две машины используются для прогнозов погоды, а третья обеспечивает исследования и возможности развития. Метеорологическое бюро также имеет систему Isambard 1 на базе Arm и планирует задействовать систему Isambard 2, когда та будет завершена.

Постоянный URL: http://servernews.ru/1032694
14.02.2021 [19:52], Владимир Мироненко

Чешские метеорологи получили суперкомпьютер NEC: 384 векторных ускорителя SX-Aurora, 18 Тбайт HBM2, 24 Тбайт DDR4 и 2 Пбайт СХД

Корпорация NEC объявила о вводе в эксплуатацию Чешским гидрометеорологическим институтом (CHMI) суперкомпьютера NEC SX-Aurora TSUBASA, который будет использоваться для моделирования регионального климата с высоким разрешением.

Суперкомпьютер SX-Aurora TSUBASA был поставлен институту компанией NEC Deutschland GmbH в сентябре 2020 года, а об его эксплуатационной готовности было объявлено в декабре 2020 года.

В основе решения лежат 48 хостов, содержащих 384 векторных ускорителя Vector Engine типа VE 20B в системе с прямым жидкостным охлаждением (DLC) вместе с полностью неблокирующим высокоскоростным интерконнектом на основе Mellanox HDR InfiniBand, а также в общей сложности 18 Тбайт высокоскоростной памяти HBM2 и 24 Тбайт оперативной памяти DDR4. Кроме того, была развёрнута параллельная СХД на основе NEC LxFS-z Storage Appliance с полезной ёмкостью более 2 Пбайт.

NEC реализовала высокоэффективное охлаждение, объединив DLC и охлаждения панелей, чтобы избежать утечки отработанного тепла в компьютерный зал, что позволяет всей системе и окружающей среде работать без дополнительного кондиционирования воздуха в помещении. В целом, готовое решение демонстрирует гораздо лучшую энергоэффективность, чем изначально было определено требованиями тендера.

Новая система будет использоваться для моделирования будущего климата и того, как его изменения проявятся. Например, это поможет спрогнозировать будущую частоту и интенсивность периодов засухи или экстремальных погодных явлений, таких как внезапные наводнения и сильные ветры. Конечная цель проекта — помочь смягчить последствия изменяющегося климата. Кроме того, суперкомпьютер будет задействован для адаптации и оптимизации ряда метеорологических и климатических приложений.

«Мы очень рады ввести в эксплуатацию новый NEC SX-Aurora TSUBASA. Для нас векторная технология NEC, используемая в SX-Aurora TSUBASA, представляет собой весьма привлекательную альтернативу конкурирующим технологиям высокопроизводительных вычислений, тем более что нам не нужно переписывать большинство наших рабочих приложений. Ещё одним большим преимуществом является отличная энергоэффективность», — сообщила д-р Радмила Брозкова (Radmila Brozkova), руководитель отдела CHMI Numerical Weather Prediction.

Постоянный URL: http://servernews.ru/1032607
Система Orphus