Материалы по тегу: xilinx

20.03.2021 [13:47], Сергей Карасёв

Xilinx представила компактные решения UltraScale+ для периферийных вычислений

Компания Xilinx расширила семейство продуктов UltraScale+, анонсировав ультракомпактные изделия Artix и Zynq, рассчитанные на применение в сфере периферийных (edge) вычислений. Чипы позволят решать различные задачи в сферах машинного зрения, вещания, здравоохранения, транспорта и пр.

Новинки будут производиться по 16-нанометровой технологии и использовать упаковку InFO (Integrated Fan-Out) компании TSMC. Утверждается, что изделия приблизительно на 70 % компактнее традиционных современных чипов.

Новое семейство Artix UltraScale+ включает небольшие ПЛИС (FPGA). Они отлично подходят для машинного зрения, высокоскоростных сетевых устройств, видеооборудования класса 8K-Ready и пр. Упомянуты трансиверы с пропускной способностью 16 Гбит/с.

В свою очередь, решения Zynq UltraScale+ — это микропроцессорные системы на кристалле (MPSoC), оптимизированные с целью снижения стоимости. Они могут содержать два или четыре вычислительных ядра ARM Cortex-A53, а также программирые элементы и DSP. Эти изделия подходят для оборудования Интернета вещей, интегрируемых видеокамер, различного медицинского оборудования и пр.

Пробные производство и поставки новых чипов планируется организовать в третьем квартале текущего года. Подробности о новинках представлены в презентации компании.

Постоянный URL: http://servernews.ru/1035347
23.02.2021 [19:24], Сергей Карасёв

Xilinx представила 100GbE-адаптеры Alveo SN1000 с FPGA и 16-ядерным ARM CPU на борту

Компания Xilinx анонсировала «умные» сетевые адаптеры Alveo SN1000, рассчитанные на использование в современных центрах обработки данных с высокой нагрузкой. Пробные поставки изделий уже начались, а массовые продажи планируется организовать 31 марта.

Устройства относятся к решениям SmartNIC. Они позволяют перенести нагрузку с центральных процессоров серверов непосредственно на сетевые адаптеры, оптимизировав тем самым работу всей IT-инфраструктуры. Адаптеры Alveo SN1000 являются полностью программно-определяемыми и подходят для создания компонуемой инфраструктуры.

В их основу положена 16-нм FPGA XCU26 серии UltraScale+, дополненная SoC от NXP с 16 ядрами ARM Cortex-A72 (2 ГГц, 8 Мбайт кеш). Процессору выделен один, а FPGA — два 4-Гбайт модуля памяти DDR4-2400. Первенец семейства, адаптер SN1022, выполнен в виде FHHL-карты с интерфейсом PCIe 3.0 x16 / PCIe 4.0 x8 и двумя 100GbE-портами QSFP28.

Для набортной SoC заявлена совместимость с Ubuntu и Yocto Linux. В качестве основного хранилища есть 16-Гбайт NAND-модуль eMMC, а для загрузчика — NOR-чип ёмкостью 64 Мбайт. Среди совместимых ОС для хоста указаны RHEL, CentOS и Ubuntu.

Фактически в состав адаптера входят и control plane, и data plane. Поддерживается аппаратная разгрузка virtio-net, а также ускорение работы Intel DPDK и Onload TCPDirect, Open Virtual Switch, Ceph RDB, IPSec и так далее. Часть функциональности перешла по наследству от SolarFlare, но Xilinx пошла дальше и открыла доступ к готовым IP-решениям в магазине App Store.

В магазине пока нет готовых решений для SN1000, но для этой серии доступна платформа разработки Xilinx Vitis. Более подробную информацию о новинках можно найти здесь. Вместе с новыми SmartNIC и магазином компания также представила платформы Smart World и Accelerated Algorithmic Trading (ATT). Первая предназначена для ИИ-видеоаналитики в режиме реального времени, а вторая, как нетрудно догадаться, для высокочастотного трейдинга (HFT).

Постоянный URL: http://servernews.ru/1033338
05.01.2021 [22:01], Алексей Степин

S2C Prodigy Logic Matrix: новые вершины FPGA-прототипирования

Микросхемы с программируемой логикой (ПЛИС/FPGA) обеспечивают максимальную гибкость, в том числе, и при разработке новых процессорных архитектур. Компания S2C, известный поставщик средств разработки и прототипирования микроэлектроники начала поставки новых систем эмуляции и отладки под общим названием Prodigy Logic Matrix.

Требования к вычислительным мощностям, в том числе, и самих ПЛИС, постоянно растут. Нередко речь заходит о создании систем, включающих в себя более одной такой микросхемы, а иногда речь идёт о десятках ПЛИС, которые должны работать в составе одного вычислительного комплекса. Но встаёт вопрос об оптимальной системе интерконнекта, единого ответа на который в индустрии нет.

Новые системы Prodigy Logic Matrix позволяют обойти данный вопрос, поскольку не имеют жёстко заданной схемы межсоединений. Каждый такой модуль S2C содержит 8 мощных ПЛИС, в стандартную стойку может входить до 8 модулей, что дает тестовый комплекс из 64 ПЛИС в одной стойке. И это не предел, предусмотрена возможность дальнейшего расширения.

В основе каждого модуля Prodigy Logic Matrix лежит 20-нм матрица Xilinx Virtex UltraScale VU440. Это проверенное временем и хорошо задокументированное решение, имеющее свыше 5,5 миллионов логических ячеек, 2880 слайсов DSP и 48 трансиверов со скоростью 16,3 Гбит/с. Ожидаемый масштаб эмуляции ASIC в для LX1 составляет 240 миллионов ASIC-вентилей на каждую ПЛИС. Уже во втором квартале компания собирается выпустить вторую версию Logic Matrix LX2 на базе более сложных чипов Xilinx UltraScale+ VU19P, что должно повысить масштаб эмуляции до 392 миллионов ASIC-вентилей. Пока речь идёт о поставках первой версии Logic Matrix, которые уже начались.

Возвращаясь к вопросу о межсоединениях: каждая из восьми ПЛИС на плате Logic Matrix окружена множеством высокоплотных разъёмов Samtec: 64 LVDS, 80 mini-SAS и 8 специализированных высокоскоростных порта. Для связи между соседними FPGA используется интерконнект ShortBridge, а для остальных — SysLink. Кроме того, есть TransLink со встроенными SerDes-блоком для удалённого подключения по медным или оптическим кабелям.

Prodigy Logic Matrix может работать совместно с другими компонентами S2C, включая отладочные модули MDM Debug и ProtoBridge; последний посредством интерфейса AXI-PCIe позволяет подключать рабочую станцию, управляющую всей системой. Кроме того, в системе Prodigy Logic Matrix предусмотрен богатый набор разнообразных дочерних плат Prototype Ready IP с поддержкой PCI Express, USB, Ethernet, HDMI и ряда других интерфейсов. Также в состав входит необходимое программное обеспечение и библиотеки. Более подробную информацию можно запросить непосредственно у компании S2C.

Постоянный URL: http://servernews.ru/1029358
03.12.2020 [11:58], Юрий Поздеев

Xilinx приобрела Falcon Computing, чтобы получить продвинутый компилятор Merlin

Xilinx приобрела Falcon Computing и теперь владеет технологиями компиляторов, для создания высокопроизводительных приложений с использованием FPGA и адаптивных систем на кристалле (SoC).

Falcon Computing Solutions разработала технологии оптимизации для компилятора высокого уровня (HLS), который позволяет использовать аппаратное ускорение для приложений. Xilinx заявила, что после приобретения Falcon Computing, ее технологии адаптивных вычислений станут более доступными для разработчиков программного обеспечения за счет улучшения унифицированной программной платформы Vitis с помощью автоматизированных оптимизаций для аппаратного обеспечения.

Интеграция технологий Falcon Computing в платформу Vitis позволит ускорять приложения, написанные на C++, не обладая при этом глубокими знаниями оборудования, что снижает нагрузку на разработчиков приложений при адаптации своего кода для конкретного «железа». По словам Falcon Computing, использование Merlin позволяет достигать ускорения на порядок больше, чем при использовании обычных средств разработки, за счет повторного использования данных при вычислениях, разделения памяти, параллельного и конвейерного ускорения вычислений.

Использование единого исходного кода, по стилю похожего на OpenMP, очень удобно для большинства разработчиков на C/C++, которые привыкли использовать стандартные конструкции языка программирования при разработке своих приложений.

Компилятор Merlin от Falcon Computing позволяет приложениям использовать параллельные вычисления в комбинации со специализированным оборудованием, таким как многоядерные процессоры, графические ускорители и FPGA. Компилятор автоматически преобразует код, написанный на C/C++ в код для FPGA, таким образом устраняя разрыв в специализированных навыках разработчиков и делая доступным эту технологию для более широкого круга программистов, которые до этого имели сложности с оптимизацией кода для гетерогенных платформ.

Falcon Computing не первая компания, которую купила Xilinx, в 2010 году она приобрела AutoESL (который теперь стал платформой Vitis), в 2013 году Neptune Design Automation (теперь Vivado). Xilinx стремится создать большую экосистему для эффективной разработки, покупая профильные компании, причем это не поглощение с целью уничтожения конкурентов, а приобретение технологий, с целью расширения своего бизнеса.

Постоянный URL: http://servernews.ru/1026894
23.11.2020 [15:39], Андрей Галадей

Kameleon ProSPU станет первым чипом безопасности, совместимым с OCP Hardware Root of Trust

Стартап Kameleon объявил о сотрудничестве с Xilinx. В рамках партнёрства планируется выпустить новый продукт для кибербезопасности — чип под названием ProSPU (проактивный блок обеспечения безопасности), который можно использовать как аппаратный Root of Trust (RoT).

Он же станет первым чипом, совместимым со спецификацией Open Compute Project (OCP) Hardware Root of Trust для серверов, центров обработки данных и облачных вычислений. Первая версия спецификации была выпушена на прошлой неделе. В её рамках подразумевается, что при любых действиях с прошивками (загрузка устройство обновление, восстановление и прочее), они должны проходить аутентификацию.

itpeernetwork.intel.com

itpeernetwork.intel.com

Это позволит обнаружить любые попытки вторжения и/или изменения. Новый же чип должен, как утверждается, защищать серверные и облачные системы на всех этапах — от загрузки до ежедневной работы, обеспечивая ту самую аутентификацию.

В Xilinx заявили, что система работает в соответствии со стандартами OCP, динамически защищая вычислительную платформу на всех этапах работы. При этом в будущем обещано, что исходный код ProSPU выпустят для сообщества. А готовые решения с чипами проактивной защиты появятся в 2021 году. Разработчики надеются, что новые решения найдут применение не только в серверах гиперскейлеров.

Постоянный URL: http://servernews.ru/1026030
19.11.2020 [22:01], Алексей Степин

SC20: AMD ROCm объединит CPU, GPU и FPGA Xilinx

В настоящее время можно сказать, что вычислительные устройства различных типов — ЦП, графические процессоры, ПЛИС, DPU и другие ускорители — существуют практически отдельно друг от друга. И каждый случай, требующий их совместной работы, приходится рассматривать отдельно. Однако будущее за конвергенцией: куда проще и выгоднее иметь единую открытую программную платформу, позволяющую легко комбинировать различные ускорители, составляя из них систему, способную оптимально решать поставленные перед ней задачи.

Intel продвигает oneAPI как единую, универсальную платформу для разработки под все вычислительные платформы сразу. У AMD же есть проект ROCm, который позволяет объединить усилия CPU и GPU, а теперь — хотя сделка до конца не закрыта — FPGA Xilinx. На SC20 компании провели первую демонстрацию работы.

Ускорители Xilinx Alveo, как, впрочем, и любые ускорители на базе достаточно сложных ПЛИС, имеют широчайший спектр применения, от чисто вычислительных задач до вспомогательных, вроде обслуживания «умных» сетевых соединений и работы в качестве «сопроцессора данных» (DPU). Суть проведённой AMD демонстрации в том, что за счёт службы трансляции адресов PCIe (Address Translation Service, ATS) платы Alveo получают доступ к ресурсам памяти других устройств, будь то системные процессоры или ГП-ускорители.

Платформа AMD ROCm позволяет унифицировать такие процессы, как обнаружение и резервирование ресурсов ПЛИС в ускорителях Alveo. При этом обеспечивается безопасная изоляция ресурсов памяти для каждого пользователя, синхронизация ускорителей Alveo и Instinct, а за распределение нагрузки пользовательских запросов используется тот же механизм, что и для плат Instinct.

Такой подход должен действительно упростить и унифицировать создание HPC-систем нового поколения, которые будут сочетать в себе ускорители различных типов. Подробнее о технологии ROCm можно узнать на сайте AMD. Поскольку платформа является открытой, следует ожидать появления нового кода и в репозиториях ROCm на GitHub.

Постоянный URL: http://servernews.ru/1025811
18.11.2020 [16:58], Сергей Карасёв

Alpha Data представила FPGA-ускоритель ADM-PA100 с ядрами Xilinx Versal AI

Компания Alpha Data анонсировала акселератор с поддержкой адаптивных вычислений ADM-PA100: изделие с настраиваемой архитектурой ввода/вывода предназначено для использования в составе систем высокопроизводительных вычислений, машинного обучения, аналитики сложных данных и пр.

В основу изделия положена платформа Versal AI Core, включающая массив движков Xilinx AI Engines. О возможностях данного аппаратного решения можно подробно узнать в нашем материале. Акселератор ADM-PA100 предлагает возможности адаптивных вычислений и сделан в виде карты расширения, которая может быть установлена в настольную рабочую станцию или стоечный сервер.

Новинка требует для монтажа наличие разъёма PCI Express 3.0 x16. Ускоритель выполнен в виде двухслотовой карты расширения с габаритами 267,2 × 126,3 × 39,9 мм.

Заявленный диапазон рабочих температур простирается от 0 до 55 градусов Цельсия. Более подробно с техническими характеристиками ускорителя можно ознакомиться здесь.

Постоянный URL: http://servernews.ru/1025695
11.11.2020 [17:07], Алексей Степин

Умные накопители Samsung SmartSSD с FPGA Xilinx выходят на рынок

Так называемые «вычислительные» или «умные» накопители продолжают покорять рынок. Несколько дней назад компания NGD Systems завершила создание своей серии вычислительных SSD, дополнив существующие модели версией в форматe EDSFF E1.S.

Теперь к поставщикам такого рода решений присоединилась корпорация Samsung, наконец-то начавшая поставки накопителей SmartSSD, в основе которых лежат ПЛИС Xilinx.

Напомним, что сама концепция «умного» SSD проста: это накопитель, несущий на борту помимо традиционного контроллера флеш-массива и достаточно мощный процессор общего назначения, обычно на базе архитектуры ARM. Наличие такого процессора позволяет разгрузить сервер или систему хранения данных от ряда рутинных операций, выполняемых обычно центральными процессорами. Каких именно операций — зависит от программного обеспечения такого SSD.

Подход альянса Samsung и Xilinx к проектированию вычислительных SSD в корне отличается от принятого NGD: в качестве вычислительного ядра в SmartSSD используется не классический процессор, а программируемая логическая матрица Xilinx из серии UltraScale. Программирование для ПЛИС сложнее разработки обычного ПО, но это окупается расширенными возможностями, а в ряде случаев — и более высокой производительностью.

Впервые накопители SmartSSD были продемонстрированы на конференции SC18. Эти прототипы использовали форм-фактор классической платы расширения с разъёмом PCI Express. Это не самый удобный формат для сколько-нибудь масштабных систем хранения данных, поскольку количество слотов PCIe в системе обычно достаточно сильно ограничено, за исключением отдельных специализированных моделей серверов.

Но серийные накопители SmartSSD, которые Samsung, наконец, официально представила, имеют более традиционный форм-фактор U.2. Внутри такой накопитель состоит из двух основных функциональных блоков: обычного массива V-NAND TLC ёмкостью 4 Тбайт с контроллером Samsung и ПЛИС Xilinx Kintex UltraScale+ KU15P, которая имеет собственный пул оперативной памяти объёмом 4 Гбайт. В стандартном серверном корпусе высотой 2U можно разместить до 24 таких накопителей, суммарный объём флеш-массива при этом составит 96 Тбайт.

SmartSSD может работать в качестве классического SSD, но с помощью стандартного стека OpenCL и средств разработки Xilinx разработчик ПО может задействовать и ресурсы набортной ПЛИС для выполнения нужных ему задач. Для реализации различных ускорителей в ПЛИС доступно примерно 330 тысяч логических ячеек из 523 тысяч, имеющихся в составе Kintex UltraScale+ KU15P. В этих ячейках можно создать либо новый вычислительный модуль под уникальные нужды заказчика, либо использовать уже имеющиеся реализации различных ускорителей и вычислительных блоков для ПЛИС.

Некоторые возможности уже доступны в рамках инициативы Xilinx Storage Services, например, IP-блоки для сжатия/декомпрессии и шифрования данных. Но возможности SmartSSD намного шире, и ничто не мешает реализовывать более сложные сценарии обработки данных, вплоть до аналитики баз данных или обработки HDR-видеоконтента.

Накопители SmartSSD хороши ещё и тем, что вычислительные ресурсы СХД, построенной на базе таких SSD, будут расти по мере увеличения количества накопителей. К примеру, компания Lewis Rhodes Labs уже предлагает системы хранения данных NPUSearch, в которых все операции поиска и индексации данных выполняются за счет ПЛИС на борту накопителей. Другой партнёр Xilinx,  Eideticom, сообщает о том, что в их системе, использующей фреймворк NoLoad SSD при коэффициенте сжатия данных 10x загрузка центрального процессора сервера на 70% ниже за счёт использования ресурсов SmartSSD.

К сожалению, несмотря на рост популярности стандарта PCI Express 4.0, в текущей версии Samsung SmartSSD реализована поддержка только PCIe 3.0 в виде стандартных для форм-фактора U.2 четырёх линий с совокупной пропускной способностью 32 Гбит/с. Освоение новых версий PCIe, впрочем, значится в планах альянса Samsung ‒ Xilinx.

Xilinx не без оснований считает, что за вычислительными накопителями будущее. Уже в течение ближайших лет компания ожидает, что на долю таких SSD будет приходиться не менее 5% рынка твердотельных накопителей. В настоящий момент SmartSSD доступны для предварительного заказа, а массовые поставки новинок планируется начать в январе следующего года. Среди других похожих проектов можно упомянуть сопроцессоры и smart-накопители PLIOPS и ScaleFlux для ускорения работы баз данных.

Постоянный URL: http://servernews.ru/1025144
09.10.2020 [19:02], Алексей Степин

iW-RainboW-G35D: мощный комплект разработчика для FPGA Xilinx

На рынке программируемых матриц (ПЛИС) сейчас доминируют два имени — Intel, поглотившая в 2015 году разработчика ПЛИС Altera, и Xilinx. Обе компании в последнее время анонсировали несколько новых продуктов, и на этот раз настала очередь Xilinx, для решений которой представила новый высокопроизводительный комплект разработчика с Zynq UltraScale+ ZU19EG.

В ближайшем будущем нас ожидает бум беспроводных сетей нового поколения, но вместе с этим продолжит расти и популярность машинного обучения, да и требования к системам трансляции видео тоже возрастут по мере перехода на формат 4К или даже более высокие разрешения. Создание решений для этих сфер требует высокопроизводительных средств разработки и новый комплект Xilinx Zynq UltraScale+ ZU19EG к таким средствам можно причислить в полной мере. Он построен на базе старшей ПЛИС в серии UltraScale+ EG.

Сама микросхема ZU19EG поистине универсальна: в её составе имеется четыре ядра общего назначения ARM Cortex-A53, два ядра реального времени ARM Cortex-R5 и массив конфигурируемой логики, состоящий из 1,143 млн ячеек и 1968 «слайсов» DSP. Имеется также не слишком мощный, но хорошо документированный и проверенный временем графический ускоритель Mali-400 MP2.

На главной плате нового комплекта (iW-RainboW-G35M) распаяно 8 Гбайт памяти DDR4, но она поделена на два массива по 4 Гбайт — для вычислительной части и для части, содержащей программируемую логику. Для загрузки дополнительно имеется 8 Гбайт флеш-памяти eMMC. Трансиверная часть очень развита и включает в себя четыре трансивера PS-GTR (6 Гбит/с), 32 трансивера PL-GTH (16,3 Гбит/с) и 16 трансиверов PL-GTY (32,735 Гбит/с). Дополнительно имеются контроллеры физического уровня Gigabit Ethernet и USB 2.0.

Несущая плата, своеобразный аналог материнской платы, содержит множество различных интерфейсов. В частности, она располагает портами SDI и HDMI на вход и выход, слотом PCIe x4, сетевыми «корзинами» SFP+ и QSFP+, а также разъёмами PMC+, FMC, FireFly и Pmod. Питается плата от стандартного DIN-разъёма 12 В.

Новый комплект разработки универсален. В частности, он позволяет разрабатывать системы трансляции видео нового поколения, поскольку поддерживает ввод и вывод видео в формате 4K при 60 к/с. Но столь же хорошо он подойдёт для проработки решений для беспроводных сетей 5G и сетевых решений класса 100G. Подробной информации о сопровождающем комплект программном обеспечении Xilinx пока не опубликовала, известно лишь о Linux BSP.

Постоянный URL: http://servernews.ru/1022607
16.09.2020 [18:23], Алексей Степин

Xilinx T1: FPGA-ускоритель для сотовых сетей ORAN нового поколения

Ускорители на базе программируемых логических схем (ПЛИС) продолжают активно завоевывать всё новые сферы, а особенно активно они применяются в коммуникационных и сетевых сценариях. Компания Xilinx, один из признанных лидеров в создании мощных ПЛИС, анонсировала новый ускоритель T1, предназначенный для использования в сфере Open Radio Access Network (ORAN).

Концепция открытых сетей радиодоступа была впервые предложена некоммерческой организацией O-RAN, основанной крупными мировыми операторами мобильной связи. Этот альянс поставил перед собой задачу выработки открытых требований и стандартов, описывающих радиочастотные сети нового поколения. В основе лежит виртуализация и использование платформ со стандартной открытой архитектурой, позволяющей провайдерам связи не быть привязанными к закрытым и дорогим решениям крупных поставщиков подобного рода оборудования. Решение Xilinx, представившей T1, в этом свете выглядит совершенно логичным — ПЛИС сочетают в себе гибкость программно-определяемого подхода с мощностью чисто аппаратных решений.

Благодаря ORAN, новые сети пятого поколения должны стать более гибкими и массовыми, нежели это случилось с рынком 4G LTE, который сильно полагается на проприетарные ОЕМ-решения. Задача Xilinx T1 — находиться на стороне базовой станции и выполнять конвертацию сетевого потока в стандартные ORAN-протоколы, подавая их на входы и выходы радиотрансиверов.

В традиционных базовых станциях обычно обычно применяется три класса чипов: процессор общего назначения, выполняющий обработку пакетов на уровнях 2 и 3, базовый FPGA или ASIC, ответственный за реализацию физического уровня, и так называемый fronthaul-FPGA, преобразующий трафик CPRI в формат, понятный вышеупомянутому контроллеру физического уровня. Xilinx T1 должен эффективно сочетать в себе качества всех трёх процессоров, что существенно упростит компоновку сервера базовой станции.

Физически это плата расширения PCI Express формата HHHL, укладывающаяся в пакет потребления 75 Ватт. На борту она несёт как fronthaul-часть (на базе Zynq RFSoC), так и мощную матрицу Zynq Ultrascale+ для всего остального. Стандартный формат позволяет использовать обычные широко распространённые серверы, поскольку слоты PCIe сейчас можно встретить везде; впрочем, системная плата должна уметь выполнять бифуркацию шины. В текущем варианте используется версия 3.0, но ожидается и скорое появление моделей с PCIe 4.0.

Xilinx реализовала в концепции T1 ряд референсных дизайнов с готовыми блоками IP, уже реализованными в набортных ПЛИС, так что ускорители практически готовы к работе прямо «из коробки» и провайдеру, решившему использовать это решение, не придется разрабатывать всё с нуля. Вместо этого можно сочетать готовые IP на плате и блоки от третьих разработчиков. Что интересно, T1 уже доступен к заказу, хотя Xilinx обычно объявляет новинки за квартал или более до начала массовых поставок.

Постоянный URL: http://servernews.ru/1020793
Система Orphus