Материалы по тегу: hpc
02.03.2021 [15:43], Сергей Карасёв
ASRock Rack MEC2U-EP2C621D16/4LP: HPC-сервер на базе Intel Xeon ScalableКомпания ASRock Rack анонсировала стоечный сервер MEC2U-EP2C621D16/4LP, предназначенный для использования в составе платформ высокопроизводительных вычислений (НРС). В основу новинки положена аппаратная платформа Intel. Допускается установка двух процессоров Intel Xeon Scalable второго поколения в исполнении LGA3647 (Socket P) с показателем TDP до 205 Вт. Для модулей оперативной памяти DDR4-2933 доступны в общей сложности 16 слотов, а максимально допустимый объём ОЗУ составляет 2 Тбайт. ![]() Во фронтальной части предусмотрены шесть отсеков для 2,5-дюймовых накопителей SAS/SATA/NVMe с возможностью «горячей» замены. Кроме того, можно установить два твердотельных модуля M.2. ![]() Для карт расширения есть пять слотов PCIe 3.0 x16 и один разъём PCIe 3.0 x8. Сервер имеет формат 2U с габаритами 456 × 446 × 87 мм. Подсистема питания выполнена на основе двух блоков мощностью 800 Вт с сертификацией 80 PLUS Platinum. ![]() Доступны четыре сетевых порта 1GbE, а также выделенный сетевой порт управления на базе контроллера Realtek RTL8211E. На фронтальной панели расположены четыре разъёма USB 3.2 Gen1 Type-A, последовательный порт и аналоговый интерфейс D-Sub.
02.03.2021 [15:39], Андрей Галадей
Codeplay и ряд НИИ работают над расширением использования компилятора LLVM SYCL для Nvidia A100Национальный энергетический научно-исследовательский вычислительный центр (NERSC), Национальная лаборатория им. Лоуренса в Беркли (LBNL) и вычислительный центр Argonne Leadership Computing Facility (ALCF) совместно с Codeplay Software работают над расширением возможностей компилятора LLVM SYCL GPU для ускорителей NVIDIA A100. ![]() aesin.org.uk Эта программа должна помочь разработчикам создавать высокопроизводительные приложения, которые можно переносить между архитектурами различных типов. Отметим, что британская компания Codeplay уже давно занимается разработкой компиляторов и инструментов для различных аппаратных архитектур. В числе её проектов — компиляторы SYCL, а также другие решения для платформы NVIDIA V100
SYCL — это открытый стандарт, поддерживаемый Khronos Group. Впервые его показали в 2014 году. Это открытый кроссплатформенный уровень абстракции, который позволяет писать код для гетерогенных процессоров. SYCL будет поддерживаться на грядущем экзафлопсном суперкомпьютере Aurora Министерства энергетики США.
02.03.2021 [13:59], Сергей Карасёв
ARM-чипы усиливают позиции в ЦОД и HPC и способны занять до 10% серверного рынкаКомпания ARM, известный разработчик энергоэффективных чипов для мобильных устройств, укрепляет позиции на рынке процессоров для центров обработки данных и систем высокопроизводительных вычислений (НРС). Об этом говорит анализ рынка, проведённый специалистами Digitimes Research. Серверы на базе ARM привлекают операторов крупных дата-центров и облачных платформ по двум основным причинам. Это меньшие стоимость и энергопотребление по сравнению с решениями, имеющими архитектуру х86. ![]() Иллюстрации ARM На фоне пандемии наблюдается быстрый рост спроса на всевозможные облачные услуги. Кроме того, интенсивно развиваются платформы искусственного интеллекта и машинного обучения. В этой ситуации компании вроде Amazon и Microsoft вынуждены наращивать парк серверов. Выбор изделий на базе ARM обеспечивает высокое соотношение цены/производительности и одновременно предоставляет гибкие возможности в плане конфигурирования систем. По мнению аналитиков, в обозримом будущем чипы с архитектурой ARM могут занять до 10 % рынка серверных процессоров. В качестве сдерживающих факторов называются слабо развитая экосистема программного обеспечения, отсутствие широкого выбора материнских плат и подходящих серверных корпусов.
26.02.2021 [18:55], Алексей Степин
Гибридный суперкомпьютер Wisteria получит ARM-процессоры Fujitsu A64FX, Intel Xeon Ice Lake и ускорители NVIDIA A100Как известно, лидер всемирного рейтинга суперкомпьютеров, японский кластер Fugaku, имеет гомогенную архитектуру и полностью построен на процессорах Fujitsu A64FX, сочетающих архитектуру ARM v8 и фирменные векторные 512-битные расширения. Такие системы проще в программировании, но это не значит, что процессоры Fujitsu не способны работать в комплексе с сопроцессорами иных архитектур и разработчиков. И новый японский суперкомпьютер Wisteria/BDEC-01 будет гетерогенным по своей природе. ![]() Проект Wisteria — детище Токийского университета, создаваемое с целью поддержки проекта «Society 5.0». Не секрет, что Япония испытывает немало проблем, как экономических, так и социальных: старение общества, снижение численности трудоспособного населения, устаревшая инфраструктура и множество других, включая экологию. Для поиска решений и был создан вышеназванный проект, но лишь сейчас он получит серьёзную вычислительную поддержку. Новый суперкомпьютер будет состоять из двух основных частей: симуляционной под названием Odyssey и кластера анализа данных, названного Aquarius. Эти названия были даны в честь командного и посадочного модулей лунного проекта «Аполлон 13». Пиковая производительность должна находиться в районе 33,1 Пфлопс на вычислениях двойной точности, при этом кластер Odyssey станет второй по производительности HPC-системой на базе ARM, уступая только Fugaku. ![]() Кластер Odyssey будет состоять из 20 стоек Fujitsu PRIMEHPC FX1000, включающих в себя 7680 узлов на базе 48-ядерного процессора A64FX, дополненного 32 Гбайт памяти HBM2 (240 Тбайт совокупно). Для соединения узлов, как и в Fugaku, задействуется фирменная шина Tofu-D с пропускной способностью 13 Тбайт/с. А вот кластер Aquarius имеет совсем другую архитектуру. Он получит 45 узлов на базе серверов Fujitsu PRIMERGY GX2570. Каждый узел располагает двумя процессорами Intel Xeon Ice Lake и восемью ускорителями NVIDIA A100; общий объём оперативной памяти составляет 36,5 Тбайт. Для соединения здесь используется сеть InfiniBand HDR 200 Гбит/с, а с кластером Odyssey связь будет осуществляться посредством InfiniBand EDR (100 Гбит/с). ![]() С внешним миром Wisteria будет связана интерфейсами 25GbE с совокупной пропускной способностью 800 Гбит/с. Новый суперкомпьютер получит две подсистемы хранения данных на базе Fujitsu Exabyte File System (в основе файловая система Lustre). Быстрая NVMe-часть объёмом 1 Пбайт обеспечит скорость 1 Тбайт/с, а более медленная ограничится скоростью 500 Гбайт/с, зато её объём составит 25,8 Пбайт. С точки зрения программной поддержки всё выглядит довольно обычно: говорится о поддержке стандартных HPC-решений и компиляторов, включая Fortran, C/C++ и Python, а также библиотек MPI. Однако архитектурно Wisteria уникальна, она включает в себя, как минимум, три архитектуры — ARM, x86-64 и NVIDIA Ampere, и ряд вопросов, касающихся программирования столь необычной системы, пока остаётся открытым. ![]() Для новой системы разрабатывается специальная программная платформа h3-Open-BDEC (Hierarchical, Hybrid, Heterogeneous; Big Data and Extreme Computing), которая должна интегрировать задачи симуляции, анализа данных и машинного обучения в единое целое. На развитие этой платформы уже выделен правительственный грант в объёме 157 млн японских йен ($1,48 млн), рассчитанный на пять лет. Первые пробные запуски Wisteria/BDEC-01 намечены на 14 мая 2021 года, а начало полномасштабной эксплуатации нового суперкомпьютера запланировано на октябрь. Это первый случай, когда для поиска решений социально-экономических и общественных проблем будет задействованы столь серьёзные вычислительные ресурсы.
24.02.2021 [11:42], Владимир Мироненко
SiPearl и Open-Silicon Research будут совместно разрабатывать 6-нм ARM-чип для HPCКомпания SiPearl, разрабатывающая высокопроизводительный и энергоэффективный микропроцессор для европейского суперкомпьютера, и Open-Silicon Research, индийское подразделение OpenFive, ведущего поставщика кастомных кремниевых решений с различными IP, объявили о заключении многолетнего соглашения о сотрудничестве с целью разработки 6-нм ARM-чипа для высокопроизводительных вычислений (HPC) с использованием 2.5D-упаковки. ![]() 6-нм система на кристалле (SoC) SiPearl Rhea будет производиться компанией TSMC. OpenFive является давним партнёром TSMC в рамках программы Value Chain Aggregator (VCA). SoC нацелена на запуск приложений HPC, использующих искусственный интеллект (ИИ), таких как автономное вождение, распознавание лиц и геномика, которые генерируют огромные объёмы данных. Чип Rhea представляет собой мощное, хорошо масштабируемое решение. Чип будет основан на 64 ядрах ARM с более чем 30 млрд транзисторов и построен по 6-нм техпроцессу TSMC. SiPearl уже имеет лицензию ARM на использование ядра Neoverse V1 под кодовым названием Zeus и будет применять его в Rhea. В конструкции чипа также будут использоваться некоторые элементы RISC-V вместе с IP-блоками OSR High Bandwidth Memory (HBM2E), интерфейсом D2D и HBM-памятью в единой упаковке 2.5D. Как ожидается, новый чип поступит в продажу в четвёртом квартале 2022 года, так что ещё предстоит пройти долгий путь по его разработке и интеграции. Следует отметить, что SiPearl активно участвует в европейских проектах по разработке микросхем для высокопроизводительных вычислений, таких как проект European Processor Initiative (EPI). Она также является членом консорциума Mont-Blanc 2020 по оснащению Европы специализированным модульным и энергоэффективным высокопроизводительным вычислительным микропроцессором и участником команды PlayFrance.Digital.
22.02.2021 [22:19], Алексей Степин
Российский интерконнект Ангара-2: 200 Гбит/с при задержках до 0,8 мксПять лет назад мы рассказывали о первом поколении российского интерконнекта Ангара или, если говорить более официально, межузловой высокоскоростной коммуникационной сети для суперкомпьютеров и кластеров. В рамках Elbrus Tech Day разработчики из НИЦЭВТ рассказали про второе поколение интерконнекта под названием Ангара-2, которое будет намного быстрее и эффективнее предыдущего. В сравнении с первой версией были уменьшены задержки — они составляют менее 0,8 мкс, что ниже, нежели у нынешних InfiniBand FDR/EDR/HDR и Intel OmniPath. Снизилась и задержка на сетевой хоп. Скорость соединения выросла до 200 Гбит/с (в планах 400 Гбит/с), появилась поддержка топологий сети вплоть до 6D-тора. Как и прежде, развитая поддержка RDMA позволяет в рамках сети эффективно строить гибридные системы, включающие в себя узлы на базе архитектур x86, Эльбрус и ARM, а также различные ускорители, в том числе, на базе ПЛИС. Кроме того, создатели работают и над поддержкой NVMe-oF. А в Ангара-2 также появится полноценная поддержка SR-IOV. ![]() Для сети Ангара разработан собственный программный стек, ориентированный, в первую очередь, на высокопроизводительные вычисления. Как и в случае Intel DPDK, есть возможность общения приложений непосредственно с адаптером, минуя стандартные механизмы ядра Linux, за счёт чего и достигается низкий уровень задержек MPI. В Ангара-2 появится более широкий набор поддерживаемых типов сообщений, что упростит создание распределённых СХД на её основе. ![]() Но может Ангара работать и с TCP/IP — совсем недавно разработчики представили вторую версию стека, обеспечивающего функциональность IP-over-Angara. Этот вариант не столь производителен, зато обеспечивает совместимость с существующими IP-решениями, позволяя задействовать RDMA для, к примеру, кластерных ФС. ![]() Решения второго поколения должны появиться к концу текущего года. Контроллер Ангара-2 получит 32 линии PCIe 4.0, причём будет возможность мультихостового подключения — одна карта сможет обслуживать сразу несколько узлов. Адаптеры будут выпущены как в формате полноразмерных карт расширения с шестью портами QSFP-DD для безкоммутаторной топологии, так и в виде низкопрофильных плат с двумя портами для работы с коммутатором. В первом случае возможно объединить до 1024 узлов в 3D-тор, во втором же использование 40-портовых коммутаторов позволит связать 20480 узлов в сеть с топологией 4D-тор. Под заказ НИЦЭВТ готов создать кастомные варианты с поддержкой 6D-тора и скоростями до 400 Гбит/с на порт. ![]() Первое поколение Ангары уже давно используется в составе различных кластеров, в том числе с современными AMD EPYC Rome. Оно же будет актуально и для новых российских процессоров Эльбрус, так как в прошлом поколении, по словам представителя НИЦЭВТ, скорость работы фактически упирается в южный мост КПИ-2, который имеет только линии PCIe 2.0 x16 и x4.
22.02.2021 [16:56], Сергей Карасёв
Введён в строй самый мощный в Африке суперкомпьютер ToubkalПолитехнический университет Мухаммеда VI бен аль-Хасана (UM6P) в Рабате (Марокко) официально объявил об открытии центра обработки данных уровня Tier III, который стал пристанищем для самого мощного в Африке комплекса высокопроизводительных вычислений. Новый суперкомпьютер получил имя Тубкал (Toubkal) в честь самого высокого пика Атласских гор. В его основу положены серверы Dell Poweredge C6420, которые оснащены процессорами Intel Xeon Platinum 8276L. Эти чипы содержат 28 вычислительных ядер с возможностью одновременной обработки до 56 потоков инструкций. Номинальная тактовая частота составляет 2,2 ГГц, максимальная — 4,0 ГГц. В составе комплекса используются интерконнект Mellanox Infiniband HDR100. Ёмкость хранилища составлят более 8 Пбайт. Заявленное быстродействие Toubkal находится на уровне 3,15 Пфлопс, а пиковое — около 5 Пфлопс. Суперкомпьютер успел «засветиться» в последнем рейтинге TOP500, где он занял 98 место. А в актуальном рейтинге TOP50 самых производительных суперкомпьютеров СНГ он бы смог занять третье место. Система Toubkal смонтирована в новом Африканском суперкомпьютерном центре (ASCC). Инициативу по созданию комплекса поддержал Кембриджский университет (Великобритания). Ожидается, что суперкомпьютер будет использоваться для решения задач, связанных с искусственным интеллектом, Интернетом вещей, аналитикой данных, геномными исследованиями и пр.
19.02.2021 [15:15], Сергей Карасёв
Мощь и компактность: HGX-сервер GIGABYTE G262-ZR0 имеет высоту всего 2UКомпания GIGABYTE Technology представила сервер G262-ZR0, предназначенный для решения задач в области ИИ и аналитики данных, а также для построения систем высокопроизводительных вычислений. Новинка использует платформу NVIDIA HGX A100 4-GPU, объединяющую графические ускорители NVIDIA A100, которые связаны высокоскоростным интерфейсом NVLink. Общая вычислительная нагрузка возложена на два процессора AMD EPYC 7002 (плата MZ62-HD5), каждый из которых может содержать до 64 ядер. Для модулей оперативной памяти доступны 16 слотов: в системе можно задействовать до 4 Тбайт ОЗУ типа DDR4-3200. Предусмотрена возможность установки четырёх 2,5-дюймовых накопителей U.2 NVMe или SATA, а также двух твердотельных модулей M.2 посредством райзер-карты. ![]() Ещё один слот M.2 есть на материнской плате. Также есть один мезонин OCP 3.0 PCI 4.0 x16 и два слота PCI 4.0 x16 во фронтальной части. Все они берует линии непосредственно у процессоров. Ещё четыре слота PCI 4.0 x16 в задней части подключены посредством коммутаторов Broadcom PEX88096. Все слоты рассчитаны на низкопрофильные карты расширения. ![]() Присутствуют два сетевых порта 1GbE LAN на базе контроллера Intel I350-AM2, а также выделенный сетевой порт управления для BMC Aspeed AST2500. Питание обеспечивают два блока с сертификацией 80 PLUS Platinum мощностью 3000 Вт каждый. ![]() На фронтальную панель, помимо гнёзд для сетевых кабелей, выведены два разъёма USB 3.0, а также интерфейс mini-DP. Сервер выполнен в формате 2U с габаритами 448 × 86,4 × 760 мм. Подробные характеристики новинки доступны здесь.
16.02.2021 [11:20], Владимир Мироненко
Метеобюро Великобритании может разместить часть суперкомпьютерной системы за рубежомВ британских СМИ появились сообщения о том, что Метеорологическое бюро Великобритании рассматривает возможность размещения за границей по крайней мере части нового суперкомпьютера. В прошлом году оно объявило о выделении £1,2 млрд ($1,56 млрд) на создание самого мощного в мире суперкомпьютера, предназначенного для работы с погодой и климатом. Первый этап проекта должен начаться в 2022 году, а второй этап, стартующий в 2028 году, предполагает увеличение системы в три раза. ![]() Газета The Mail on Sunday утверждает, что высокие требования к мощности новой системы высокопроизводительных вычислений (HPC) могут означать, что официальные лица рассматривают северную Европу в качестве возможного варианта размещения части системы: «Объём электроэнергии, которую будет использовать этот суперкомпьютер, будет настолько вели, что они захотят разместить половину системы, например, где-нибудь, в Норвегии, где у них будет более чистая энергия». «Большинство наших экспертов и учёных по-прежнему находятся в Великобритании — с современными технологиями суперкомпьютеры не обязательно должны располагаться в одном здании», — сообщил The Mail on Sunday представитель Метеорологического бюро. Он добавил, что результаты тендеров пока неизвестны, и лишь после их оглашения будет ясно, каким будет решение. Согласно документу на поставку продукции Метеорологического бюро, требуется, чтобы «не менее 50 %» мощности новой системы располагалось в Соединённом Королевстве, чтобы «защищать основные общественные интересы». Также в нём указано, что «остальная часть может быть расположена за пределами Великобритании, при условии, что участник торгов сможет убедить Метеорологическое бюро в том, что правовое поле среды, в которой находится объект, не представляет риска для доступности услуг». Нынешняя суперкомпьютерная система Метеорологического бюро состоит из трёх суперкомпьютеров Cray XC40 с производительностью 14 Пфлопс. Это одна из самых быстрых систем в мире из числа предназначенных для моделирования погоды и климата, и она входила в топ-20 списка Top500 на момент установки в 2016 году. Две машины используются для прогнозов погоды, а третья обеспечивает исследования и возможности развития. Метеорологическое бюро также имеет систему Isambard 1 на базе Arm и планирует задействовать систему Isambard 2, когда та будет завершена.
14.02.2021 [19:52], Владимир Мироненко
Чешские метеорологи получили суперкомпьютер NEC: 384 векторных ускорителя SX-Aurora, 18 Тбайт HBM2, 24 Тбайт DDR4 и 2 Пбайт СХДКорпорация NEC объявила о вводе в эксплуатацию Чешским гидрометеорологическим институтом (CHMI) суперкомпьютера NEC SX-Aurora TSUBASA, который будет использоваться для моделирования регионального климата с высоким разрешением. Суперкомпьютер SX-Aurora TSUBASA был поставлен институту компанией NEC Deutschland GmbH в сентябре 2020 года, а об его эксплуатационной готовности было объявлено в декабре 2020 года. ![]() В основе решения лежат 48 хостов, содержащих 384 векторных ускорителя Vector Engine типа VE 20B в системе с прямым жидкостным охлаждением (DLC) вместе с полностью неблокирующим высокоскоростным интерконнектом на основе Mellanox HDR InfiniBand, а также в общей сложности 18 Тбайт высокоскоростной памяти HBM2 и 24 Тбайт оперативной памяти DDR4. Кроме того, была развёрнута параллельная СХД на основе NEC LxFS-z Storage Appliance с полезной ёмкостью более 2 Пбайт. ![]() NEC реализовала высокоэффективное охлаждение, объединив DLC и охлаждения панелей, чтобы избежать утечки отработанного тепла в компьютерный зал, что позволяет всей системе и окружающей среде работать без дополнительного кондиционирования воздуха в помещении. В целом, готовое решение демонстрирует гораздо лучшую энергоэффективность, чем изначально было определено требованиями тендера. Новая система будет использоваться для моделирования будущего климата и того, как его изменения проявятся. Например, это поможет спрогнозировать будущую частоту и интенсивность периодов засухи или экстремальных погодных явлений, таких как внезапные наводнения и сильные ветры. Конечная цель проекта — помочь смягчить последствия изменяющегося климата. Кроме того, суперкомпьютер будет задействован для адаптации и оптимизации ряда метеорологических и климатических приложений. «Мы очень рады ввести в эксплуатацию новый NEC SX-Aurora TSUBASA. Для нас векторная технология NEC, используемая в SX-Aurora TSUBASA, представляет собой весьма привлекательную альтернативу конкурирующим технологиям высокопроизводительных вычислений, тем более что нам не нужно переписывать большинство наших рабочих приложений. Ещё одним большим преимуществом является отличная энергоэффективность», — сообщила д-р Радмила Брозкова (Radmila Brozkova), руководитель отдела CHMI Numerical Weather Prediction. |
|