Материалы по тегу: hpc

17.06.2021 [14:37], Владимир Агапов

Cortus объявила о создании процессорного ядра RISC-V для высокопроизводительных вычислений

Компания Cortus, работающая с 2005 года на рынке услуг дизайна интегральных схем специального назначения (ASIC) и систем на кристалле (SoC), объявила на днях о разработке 64-бит процессорного Out-of-Order (OoO) ядра RISC-V для высокопроизводительных вычислений. Разработка спонсирована ЕС в рамках проекта eProcessor и проведена под патронажем Барселонского суперкомпьютерного центра (Barcelona Supercomputing Center, BSC).

В новом изделии компания реализовала полную поддержку когерентности кеш-памяти, что делает его пригодным для создания сложных мультипроцессорных систем. На его основе компания планирует выпустить модели процессоров, оптимизированные для ЦОД, искусственного интеллекта (AI), систем автопилота и помощи водителю (ADAS), а также других приложений.

Cortus является одним из первых участников RISC-V Foundation. В предыдущие годы она в основном ориентировалась на встраиваемые решения со сверхнизким энергопотреблением и создание для них комплексного набора инструментов разработчика: IDE, компиляторов, ассемблера, компоновщика, отладчика и трассировщика (с поддержкой профилирования и MC/DC для сертификации безопасности).

Проект eProcessor, координация которого возложена как раз на BSC, создан для формирования полноценной экосистемы RISC-V (аппаратные решения и ПО) с полностью открытым исходным кодом. В рамках проекта планируется разработка высокопроизводительного и энергоэффективного RISC-V процессора (в сочетании с ускорителями и специализированным ПО) для задач HPC, HPDA, ML/DL. Суммарный бюджет проекта составляет почти €8 млрд, из которых половина приходится на финансирование со стороны ЕС.

BSC также занимается проектированием одного из первых европейских суперкомпьютеров экзафлопсного класса на основе чипов RISC-V при финансировании EuroHPC в размере €1,2 млрд. Работы планируется завершить к 2024 году. Вокруг BSC уже сформировалась небольшая группа компаний по разработки чипов RISC-V. Это, в частности, Esperanto Technologies, создающая ускорители, и SiFive, разработавшая серийно выпускаемые микропроцессоры Freedom U740. В активе BSC есть и экспериментальный чип Lagarto.

В ЕС также работает консорциум European Processor Initiative (EPI), созданный для разработки и внедрения европейских чипов в различных областях — от встраиваемых компьютеров до серверов. Работу над RISC-V процессором непосредственно для европейских суперкомпьютеров в 2020 г. начала компания Silicon Pearl (SiPearl). Правда, сейчас компания готовит первый HPC-процессор Rhea на базе ARM. EPI же завершил создание первых тестовых HPC-ускорителей EPAC 1.0 на базе RISC-V.

Постоянный URL: http://servernews.ru/1041988
15.06.2021 [17:19], Сергей Карасёв

Ускорители Intel Xe Ponte Vecchio в форм-факторе OAM будут использовать СЖО

В распоряжении интернет-источников оказалась новая порция информации об ускорителях Intel Ponte Vecchio, предназначенных для использования в системах высокопроизводительных вычислений (HPC). В частности, раскрыты подробности о системе охлаждения этих акселераторов.

Как мы уже сообщали, процессор Ponte Vecchio имеет «черепичный» дизайн с 47 элементами, а общее количество транзисторов превышает 100 млрд. Предусмотрено применение 3D-компоновки Foveros и соединений EMIB. Конструкцией Ponte Vecchio предусмотрено объединение кристаллов, изготавливающихся по 7-нм и 10-нм технологиям Intel Enhanced SuperFin (ESF), а также по 7-нм (или 5-нм) технологии TSMC.

Igor's Lab

Igor's Lab

Ускорители будут выполнены в форм-факторе Open Accelerator Module (OAM), о характеристиках которого можно узнать в нашем материале. Из-за особенностей архитектуры Ponte Vecchio будет иметь TDP в районе 600 Вт или более — спецификациями OAM предусмотрено энергопотребление до 700 Вт. Поэтому ускорители будут комплектоваться системой жидкостного охлаждения (СЖО).

Igor's Lab

Igor's Lab

На появившихся в интернете изображениях показана структура Ponte Vecchio вместе с кулером. Добавим, что ускорители Ponte Vecchio обеспечат производительность свыше одного петафлопса. Система жидкостного охлаждения позволит им стабильно работать при постоянных нагрузках. Впрочем, использование СЖО в HPC-системах уже давно стало нормой.

Постоянный URL: http://servernews.ru/1042052
11.06.2021 [19:54], Владимир Агапов

Архитектура RISC-V метит в суперкомпьютеры и другие HPC-решения

Некоммерческая организация RISC-V International сообщила о намерении расширить архитектуру (ISA) новыми возможностями для поддержки высокопроизводительных вычислений (HPC) и развить экосистему ПО для них. Специально созданная группа SIG-HPC займётся включением в RISC-V более широкого набора аппаратных возможностей для HPC, необходимого для высполнения соответствующих рабочих нагрузок (AI/ML/DL).

Новая группа изучит целевые рынки, проанализирует свободные ниши и определит потенциальные возможности внедрения. По словам председателя группы, Джона Д. Дэвиса (John D Davis), сегодня HPC-решения нужны везде: от суперкомпьютеров, прогнозирующих погоду, рассчитывающих гидродинамические процессы, моделирующих новые материалы и процессы свёртывания белков, до сугубо промышленных приложений.

embedded.com

Embedded.com

«Целью SIG-HPC является обеспечение всех этих и других рабочих нагрузок. Поэтому в списке рассылки уже 141 член, среди которых есть исследователи, учёные, представители различных индустрий. И их число растет в геометрической прогрессии. Группа объединилась в том, чтобы сделать RISC-V доступным для HPC», — сказал Джон.

В ближайший год группа займётся автоматизацией обнаружения открытого HPC ПО (библиотек, фреймворков, приложений), работающего «из коробки» на архитектуре RISC-V. На базе этой работы будет создан план по дальнейшему развитию программной экосистемы. Джон надеется, что в будущем HPC-решения будут полностью открытыми. Это позволит компаниям совместно разрабатывать аппаратное и программное обеспечение, проводить больше исследований и разработок.

Для RISC-V обязательным является лишь базовый набор инструкций, который по желанию можно дополнить различными расширениями. Источник: Siemens

Для RISC-V обязательным является лишь базовый набор инструкций, который по желанию можно дополнить различными расширениями. Источник: Siemens

«Намерение вывести Open Source чипы RISC-V за пределы встраиваемых и одноплатных компьютеров и сделать их конкурентоспособным в сегменте HPC — интересная и амбициозная задача, и создание благоприятной экосистемы является важной вехой», — прокомментировал новость Филипп Вагнер (Philipp Wagner), директор некоммерческой организации FOSSi Foundation.

На базе RISC-V действительно мощных решений пока немного. Можно вспомнить 16-ядерные SoC XuanTie 910, которые Alibaba создала для своего облачного бизнеса. Правда, это проприетарное решение, и пользы сообществу RISC-V оно не принесло. Более серьёзную заявку на успех сделала Индия, которая планирует создать суперкомпьютеры на базе чипов SHAKTI. Также на базе RISC-V разрабатываются и ускорители: ИИ-чип ET-SoC-1 от Esperanto или EPI EPAC 1.0, HPC-ускоритель для будущих европейских суперкомпьютеров.

Постоянный URL: http://servernews.ru/1041807
02.06.2021 [00:24], Владимир Мироненко

Microsoft Azure объявила о доступности инстансов с NVIDIA A100

Microsoft Azure объявила о доступности инстансов ND A100 v4, своих самых мощных виртуальных машин на базе ускорителей NVIDIA A100 для работы с ИИ и высокопроизводительных вычислений (HPC) суперкомпьютерного класса. ND A100 v4 имеет восемь NVIDIA A100 (40 Гбайт), 96 ядер CPU (AMD EPYC), 900 Гбайт RAM, локальное NVMe-хранилище на 6,5 Тбайт и подключение HDR InfiniBand, обеспечивающее пропускную способность 200 Гбит/с на каждый ускоритель, т.е. суммарно 1,6 Тбит/с.

Стоимость аренды базового инстанса Standard_ND96asr_v4 указанной выше конфигурации начинается от $27,2/час. Для наиболее требовательных рабочих нагрузок возможно создание кластеров ND A100 v4, объединяющих с помощью InfiniBand тысячи ускорителей.

Чтобы упростить и ускорить разработку, каталог NVIDIA NGC предлагает готовые к использованию платформы приложений, оптимизированные для GPU, контейнеры, предварительно обученные модели, библиотеки, SDK и Helm-пакеты. Виртуальные машины ND A100 v4 также поддерживаются Azure Machine Learning, сервисом для интерактивной разработки ИИ, распределённого обучения, инференса и автоматизации с помощью ML Ops.

Развёртывание систем машинного обучения на базе ND A100 v4 упрощается с помощью NVIDIA Triton Inference Server, открытого решения, интегрированного с Azure ML и способного максимизировать производительность и использование как графического, так и центрального процессора, и минимизировать эксплуатационные расходы на развёртывание. Кроме того, вскоре появится возможность использования Azure Kubernetes Service для развёртывания и управления контейнерными приложениями на ND A100 v4.

Постоянный URL: http://servernews.ru/1040993
01.06.2021 [23:21], Игорь Осколков

Тестовый HPC-ускоритель EPAC 1.0 для будущих европейских суперкомпьютеров готов к производству

Консорциум EPI (European Processor Initiative), созданный с целью разработки собственных чипов для будущих европейских суперкомпьютеров и, таким образом, обретения независимости от США в области высокопроизводительных вычислений (HPC), сообщил об успешном завершении работ над тестовым чипом EPAC 1.0 и готовности его к производству по 22-нм техпроцессу GlobalFoundries FD-SOI (22FDX), который доступен на фабрике в Дрездене.

EPAC (European Processor Accelerators) базируется на полностью открытом наборе команд RISC-V, а тестовый чип включает сразу несколько различных типов акселераторов: два вида блоков векторной обработки (суммарно 5 шт.), блок STX (Stencil & Tensor) и блок для расчётов переменной точности, которые объединены быстрым интерконнектом. Все компоненты, включая L2-кеш и SerDes-блоки, разработаны исключительно европейскими компаниями и университетами.

Укоритель EPAC 1.0 Источник: EPI

Укоритель EPAC 1.0 Источник: EPI

По словам создателей, им удалось добиться поставленной цели — создать энергоэффективный чип, который позволил бы блокам ускорителей работать на частоте выше 1 ГГц и обмениваться данными между собой и с периферией на скорости более 200 Гбит/с. Следующее поколение чипов будет переведено на 12-нм техпроцесс, который, правда, в Европе пока не представлен, и получит чиплетный дизайн. EPAC составит компанию европейским 7-нм Arm-процессорам SiPearl Rhea, которые, согласно планам, должны появиться в этом году.

Постоянный URL: http://servernews.ru/1040991
31.05.2021 [17:41], Андрей Галадей

AMD готовит патчи для ядра Linux для поддержки суперкомпьютера Frontier

Суперкомпьютер Frontier должен стать первой системой эксафлопсного класса в США. Он использует процессоры EPYC и ускорители Radeon Instinct, а специалисты компании сейчас вносят изменения в ядро ​​Linux для использования его на новой платформе. На один из последних патчей обратил внимание ресурс Phoronix.

Архитектурно Frontier устроен так, что между CPU и GPU используется когерентный интерконнект Infinity Fabric, что позволяет CPU согласованно обращаться к памяти GPU. BIOS помечает память GPU (она же VRAM) как SPM, то есть память специального назначения.

Это требует некоторых доработок со стороны прошивок, BIOS/UEFI и системным ПО, над которыми совместно работают AMD и HPE. Собственно говоря, над поддержкой работы с такой унифицированной памятью в пределах одного узла и ведутся работы. Однако о сроках готовности и возможности попадания патчей в основную ветку ядра пока ничего не сообщается.

Постоянный URL: http://servernews.ru/1040821
28.05.2021 [00:33], Владимир Мироненко

Perlmutter стал самым мощным ИИ-суперкомпьютером в мире: 6 тыс. NVIDIA A100 и 3,8 Эфлопс

В Национальном вычислительном центре энергетических исследований США (NERSC) Национальной лаборатории им. Лоуренса в Беркли состоялась торжественная церемония, посвящённая официальному запуску суперкомпьютера Perlmutter, также известного как NERSC-9, созданного HPE в партнёрстве с NVIDIA и AMD.

Это самый мощный в мире ИИ-суперкомпьютер, базирующийся на 6159 ускорителях NVIDIA A100 и примерно 1500 процессорах AMD EPYC Milan. Его пиковая производительность в вычислениях смешанной точности составляет 3,8 Эфлопс или почти 60 Пфлопс в FP64-вычислениях.

Perlmutter основан на платформе HPE Cray EX с прямым жидкостным охлаждением и интерконнектом Slingshot. В состав системы входят как GPU-узлы, так и узлы с процессорами. Для хранения данных используется файловая система Lustre объёмом 35 Пбайт скорость обмена данными более 5 Тбайт/с, которая развёрнута на All-Flash СХД HPE ClusterStor E1000 (тоже, к слову, на базе AMD EPYC).

Perlmutter (Phase 1). Фото: NERSC

Perlmutter (Phase 1). Фото: NERSC

Установка Perlmutter разбита на два этапа. На сегодняшней презентации было объявлено о завершении первого (Phase 1) этапа, который начался в ноябре прошлого года. В его рамках было установлено 1,5 тыс. вычислительных узлов, каждый из которых имеет четыре ускорителя NVIDIA A100, один процессор AMD EPYC Milan и 256 Гбайт памяти. На втором этапе (Phase 2) в конце 2021 года будут добавлены 3 тыс. CPU-узлов c двумя AMD EPYC Milan и 512 Гбайт памяти., а также ещё ещё 20 узлов доступа и четыре узла с большим объёмом памяти.

NERSC

NERSC

Также на первом этапе были развёрнуты служебные узлы, включая 20 узлов доступа пользователей, на которых можно подготавливать контейнеры с приложениями для последующего запуска на суперкомпьютере и использовать Kubernetes для оркестровки. Среда разработки будет включать NVDIA HPC SDK в дополнение к наборам компиляторов CCE (Cray Compiling Environment), GCC и LLVM для поддержки различных средств параллельного программирования, таких как MPI, OpenMP, CUDA и OpenACC для C, C ++ и Fortran.

Фото: DESI

Фото: DESI

Сообщается, что для Perlmutter готовится более двух десятков заявок на вычисления в области астрофизики, прогнозирования изменений климата и в других сферах. Одной из задач для новой системы станет создание трёхмерной карты видимой Вселенной на основе данных от DESI (Dark Energy Spectroscopic Instrument). Ещё одно направление, для которого задействуют суперкомпьютер, посвящено материаловедению, изучению атомных взаимодействий, которые могут указать путь к созданию более эффективных батарей и биотоплива.

Постоянный URL: http://servernews.ru/1040628
27.05.2021 [07:07], Владимир Агапов

Ramon.Space получила первые инвестиции на создание космического суперкомпьютера

Ramon.Space, производитель решений для космических вычислений, привлёк $17,5 млн. инвестиций на стадии A для дальнейшего развития устойчивых к условиям космоса суперкомпьютерных систем. В число инвесторов вошли StageOne Ventures, WorldQuant Ventures, UMC Capital и действующий инвестор Grove Ventures. По заявлению Ramon.Space, целью является создание космических систем для высокопроизводительных вычислений.

Для этого нужна мощная среда, составленная из сети спутников для обработки данных, собранных в космосе или полученных с Земли. Преимущества такой инфраструктуры в том, что с помощью неё можно предоставлять услуги практически в любой точке Земли, даже если там нет наземного интернет-доступа. Кроме того, в космосе можно собирать большие объёмы и такой информации, которую не обязательно отправлять на Землю.

У компании свой подход к обеспечению надёжности устройств в условиях космоса. Её программно-аппаратный комплекс не полагается только на избыточность на уровне микроэлектронных компонентов для их устойчивости к радиационному воздействию — компания использует механизмы избыточных вычислений, алгоритмы, позволяющие обходить ошибки, вызванные воздействием радиации. Используя такую виртуальную радиационно-стойкую технологию обработки данных вкупе с собственным программируемыми чипами для задач ML/AI/DSP, компании удаётся значительно продлить жизненный цикл спутникового оборудования.

При этом стоимость такого решения намного ниже, чем у «классических» технологий. Это открывает к путь к созданию в космосе систем, которые по вычислительной мощности и надёжности не будут уступать наземным. На сегодняшний день решения Ramon.Space уже нашли применение в более чем 50 космических миссиях, в том числе в аппаратах Mars Orbiter, Solar Orbiter, Jupiter Orbiter, NASA Cygnus и других.

Постоянный URL: http://servernews.ru/1040533
22.05.2021 [15:07], Сергей Карасёв

В США подготовлен законопроект для поддержки создания суперкомпьютеров следующего поколения

До конца текущего года в Соединённых Штатах будет запущен первый в стране вычислительный комплекс экзафлопсного класса: пиковая производительность системы Frontier превысит 1,5 Эфлопс. Между тем законодатели уже изучают возможные пути стимуляции суперкомпьютерной отрасли с целью ускорения создания систем будущего.

В частности, представлен так называемый Акт об исследованиях и разработках в области вычислений следующего поколения (Next Generation Computing Research and Development Act). В документе предлагаются различные меры, нацеленные на развитие систем и технологий, возможности которых превзойдут потенциал классических платформ.

Здесь и ниже изображения pixabay.com

Здесь и ниже изображения pixabay.com

Авторы законопроекта говорят, что суперкомпьютеры нового поколения позволят найти ответы на сложные вопросы в области энергетики, прогнозирования климата и пр. В этом свете Министерству энергетики США предлагается обеспечить «исследования, разработку и демонстрацию программ для развития вычислительных и сетевых возможностей с целью моделирования, анализа и прогнозирования комплексных феноменов, связанных с созданием новых технологий в области энергетики».

В документе говорится также о разработке энергетически эффективных систем, которые помогут в развитии приложений в сфере искусственного интеллекта, машинного обучения и пр. Кроме того, предлагается ввести дополнительные меры поддержки специалистов в области высокопроизводительных вычислений.

Постоянный URL: http://servernews.ru/1040213
21.05.2021 [18:15], Сергей Карасёв

Экзафлопсный суперкомпьютер Frontier получит суперхранилище: 6 тыс. SSD и 48 тыс. HDD

Вычислительный центр OLCF (Oak Ridge Leadership Computing Facility) Окриджской лаборатории рассказал об особенностях архитектуры подсистемы хранения данных комплекса Frontier. Ввести этот суперкомпьютер в строй планируется к концу текущего года. Ожидается, что он станет первой в США системой высокопроизводительных вычислений с экзафлопсным быстродействием. В основу комплекса лягут чипы AMD EPYC и ускорители Radeon Instinct. Пиковая производительность, как ожидается, превысит 1,5 Эфлопс.

Сообщается, что архитектура ввода/вывода суперкомпьютера состоит из двух основных компонентов: это внутрисистемное хранилище и распределённое хранилище Orion, использующее открытые решения Lustre и ZFS. Внутрисистемное хранилище будет использовать интерфейс PCIe 4.0. Скорость чтения превысит 75 Тбайт/с, скорость записи — 35 Тбайт/с. Величина IOPS — свыше 15 млрд.

OLCF

OLCF

В состав Orion войдут три уровня. Первый — массив из 5400 твердотельных NVMe-накопителей суммарной вместимостью 11,5 Пбайт. Они обеспечат пиковую скорость чтения/записи до 10 Тбайт/с, а показатель IOPS превысит 2 млн. Второй уровень — система из 47 700 жёстких дисков (PMR). Их общий объём составит 679 Пбайт. Пиковая скорость чтения — 5,5 Тбайт/с, пиковая скорость записи — 4,6 Тбайт/с. Значение IOPS составит более 2 млн. Наконец, на третьем уровне, предназначенном для метаданных, будут задействованы 480 NVMe-накопителей суммарной ёмкостью 10 Пбайт.

HPE

HPE

В состав Orion войдёт 40 узлов для метаданных и 450 узлов для основного хранилища Lustre, причём последние будут разделены на три блока: один c высокой производительностью и два с высокой ёмкостью. Ещё 160 узлов будут работать в качестве «посредников» между Frontier и другими ресурсами и платформами OLCF. Они обеспечат скорость чтения/записи 3,2 Тбайт/с.

Постоянный URL: http://servernews.ru/1040156
Система Orphus