Материалы по тегу: xilinx

14.06.2022 [18:51], Алексей Степин

AMD запланировала массированное наступление на рынок машинного обучения и ИИ

C момента анонса архитектуры Zen и появления процессоров EPYC можно отсчитывать начало возвращения AMD на серверный рынок и в сферу HPC. Многие владельцы ЦОД и проектировщики суперкомпьютеров всё чаще выбирают AMD, но компания также стремится упрочнить свои позиции и на рынке систем машинного интеллекта, где долгое время доминирует NVIDIA со своей экосистемой CUDA.

Причём речь идёт о завоевании всех сегментов, от сферы периферийных вычислений до крупных облачных систем, для чего в распоряжении компании уже есть «нужный кремний и программное обеспечение». Именно такое заявление «красные» сделали на мероприятии Financial Analyst Day 2022. Глава AMD, Лиза Су (Lisa Su) отметила, что предстоит много работы, но открывающиеся перспективы роста того стоят. Наступление уже началось: отмечается интерес к процессорам EPYC для применения в инференс-системах и ускорителей Instinct для обучения нейросетей.

Охват рынка ИИ-систем и машинного обучения решениями AMD. Источник: AMD

С Instinct всё понятно, на сегодня это один из мощнейших ускорителей в отношении «чистой» производительности, а вот EPYC добились серьёзного прироста скорости исполнения инференс-нагрузок во многом благодаря благодаря библиотеке ZenDNN (Zen Deep Neural Network). Эта библиотека тесно интегрирована с популярными фреймворками TensorFlow, PyTorch и ONNXRT.

Она поддерживается процессорами EPYC, начиная со второго поколения, но компания пойдет и дальше в деле внедрения элементов ИИ в новые поколения процессоров на аппаратном уровне. Речь, в том числе, идёт о поддержке AVX-512 VNNI, которая появится в EPYC Genoa и Ryzen 7000. Ранее поддержкой таких инструкций могли похвастаться только процессоры Intel, которая активно вкладывалась в развитие ПО в течение нескольких лет.

 Адаптивная архитектура XDNA. Источник: AMD

Адаптивная архитектура XDNA. Источник: AMD

Другой путь заключается в использовании чиплетов на базе блоков Xilinx. Эта инициатива получила название адаптивной архитектуры XDNA. Нужны блоки появились ещё в серии Versal в 2018 году, а сейчас AMD намеревается снабдить аналогичным ИИ-движком ноутбучные Ryzen: Phoenix Point (2023 год) и Strix Point (2024 год). Эта же технология появится в EPYC, но точные сроки пока не оговорены, зато сообщается, что чипы с архитектурой Zen 5 c новыми оптимизациями для машинного обучения дебютируют в 2024 году.

На этом планы относительно портфолио Xilinx не заканчиваются. Решения на базе матриц Zynq давно и активно применяются в индустрии, здравоохранении, транспортных системах и «умных» производствах. Это же относится к рынку телекоммуникаций, использующему Xilinx Versal и облачным ЦОД, где довольно широко применяются ускорители Alveo и ПЛИС Kintex. И AMD ни в коем случае не собирается покидать эти секторы рынка.

Сферы и отрасли, потребности которых могут покрываться решениями AMD. Источник: AMD

Компания также активно готовит почву к пришествию своего первого серверного APU Instinct MI300. Так, пакет ROCm получил оптимизации для сценариев обучения и инференса в PyTorch и TensorFlow, и он же теперь может работать на потребительских моделях Radeon с архитектурой RDNA. AMD также разрабатывает SDK с предварительно оптимизированными моделями, что упростит разработку и внедрение ИИ-приложений.

Можно сказать, что охват рынка искусственного интеллекта и машинного обучения у AMD будет держаться на трёх китах: процессорах Ryzen и EPYC для моделей малых и средних объёмов; будущих EPYC с ИИ-блоками и ускорителях на базе Radeon и Versal для средних и больших моделей; ускорителях и APU Instinct вкупе с адаптивными чипами Xilinx для моделей большого и сверхбольшого размера.

Консолидация всех технологий ИИ, имеющихся у AMD, в единый программный стек. Источник: AMD

А для лучшей консолидации AMD активно объединяет в единый массив ранее независимые средства ПО для всех типов вычислителей. В этом она активно сотрудничает с другими компаниями, включая таких гигантов, как Microsoft и Meta*. Концепция Unified AI Stack будет развиваться и в дальнейшем, включая всё новые и новые компоненты, так что в итоге разработчику систем машинного интеллекта можно будет использовать единый набор инструментов, поддерживающий все ИИ-технологии AMD. В том же направлении движется и Intel со своей инициативой oneAPI.


* Внесена в перечень общественных объединений и религиозных организаций, в отношении которых судом принято вступившее в законную силу решение о ликвидации или запрете деятельности по основаниям, предусмотренным Федеральным законом от 25.07.2002 № 114-ФЗ «О противодействии экстремистской деятельности».

Постоянный URL: http://servernews.ru/1068024
10.06.2022 [23:31], Алексей Степин

Решения Xilinx и Pensando помогут AMD завоевать рынок ЦОД

О грядущих серверных APU MI300, сочетающих архитектуры Zen 4 и CDNA 3, и сразу нескольких сериях процессоров EPYC мы уже рассказали, но на мероприятии Financial Analyst Day 2022 компания поделилась и другими планами относительно серверного рынка, которые весьма обширны. Они включают в себя использование разработок и технологий Xilinx и Pensando.

Фактически AMD теперь владеет полным портфолио аппаратных решений для ЦОД и рынка HPC: процессорами EPYC, ускорителями Instinct, SmartNIC и DPU на базе чипов Xilinx и Pensando и, наконец, FPGA всё той же Xilinx. Долгосрочные перспективы рынка ЦОД AMD оценивает в $125 млрд, из них на долю ускорителей приходится $64 млрд, а классические процессоры занимают лишь второе место с $42 млрд; остальное приходится на DPU, SmartNIC и FPGA.

 Источник: AMD

Источник: AMD

Теперь у AMD есть полный спектр «умных» сетевых решений практически для любой задачи, включая сценарии, требующие сверхнизкой латентности. Эту роль берут на себя адаптеры Solarflare. Более универсальные ускорители Xilix Alveo обеспечат поддержку кастомных сетевых функций и блоков ускорения, а также высокую производительность обработки пакетов. Ускорители могут быть перепрограммированы, что потенциально позволит существенно оптимизировать затраты на сетевую инфраструктуру крупных ЦОД.

 Источник: AMD

Источник: AMD

Гиперскейлерам они уже поставляются, в текущем виде они имеют до двух 200GbE-портов и совокупную скорость обработки до 400 млн пакетов в секунду. Следующее поколение должно увидеть свет в 2024 году, здесь AMD придерживается двухгодичного цикла. Выпускается и 7-нм DPU Pensando Elba, также предоставляющий пару 200GbE-портов. В отличие от Alveo, это более узкоспециализированное устройство, содержащее 144 P4-программируемых пакетных движка. Помимо них имеются выделенные аппаратные движки ускорения криптографии и сжатия/декомпрессии данных.

Уникальный программно-аппаратный стек Pensando, унаследованный AMD, обеспечивает ряд интересных возможностей, востребованных в крупных системах виртуализации на базе ПО VMware — например, полноценную поддержку виртуализации NVMe, поддержку NVMe-oF/RDMA, в том числе и NVMe/TCP, а также полноценное шифрование и туннели IPSec на полной линейной скорости 100 Гбит/с с временем отклика 3 мкс и джиттером в районе 35 нс.

Источник: AMD

Разработки Pensando уже используются такими крупными поставщиками сетевого оборудования и СХД, как Aruba (коммутаторы с DPU) и NetApp (системы хранения данных). Таким образом, AMD вполне вправе говорить о том, что современный высокопроизводительный ЦОД может быть целиком построен на базе технологий компании, от процессоров и ускорителей до интерконнекта и специфических акселераторов.

Современный безопасный ЦОД может быть целиком построен на базе технологий AMD. Источник: AMD

Поддержка доверенных вычислений, включая полное шифрование содержимого памяти делает такие ЦОД и более безопасными, что немаловажно в современном мире, полном кибер-угроз. В том же направлении движутся NVIDIA BlueField и Intel IPU, а также целый ряд других игроков.

Постоянный URL: http://servernews.ru/1067763
07.06.2022 [21:44], Алексей Степин

Arista Networks анонсировала низколатентные коммутаторы 7130LBR и 7130B на базе решений AMD Xilinx и Intel Tofino

Существуют задачи, в которых главным мерилом производительности сети выступает не пропускная способность, а латентность; к таким, например, относится высокочастотный трейдинг. В погоне за неподатливыми наносекундами компания Arista Networks представила новые низколатентные коммутаторы 7130LBR-48S6QD и 7130B-32QD на базе технологий AMD Xilinx и Intel Tofino.

 Источник: Arista Networks

Источник: Arista Networks

Первая модель очень компактна, она занимает в высоту всего 1U, но при этом располагает 48 портами SFP+ и шестью портами QSFP-DD. Фактически& 7130LBR объединяет в себе низколатентный коммутатор L1+, но к нем подключен как классический кремний Broadcom Jericho 2, так и пара высокопроизводительных ПЛИС Xilinx Virtex UltraScale+ (VU9P-3). За точность отвечает тактовый генератор на базе термостабилизированного модуля OCXO. Джиттер практически отсутствует, а латентность во всех 96 линиях 10G не превышает 6 нс.

 Arista 7130LBR и его архитектура. Источник: Arista Networks

Arista 7130LBR и его архитектура. Источник: Arista Networks

Каждая из программируемых матриц имеет по 32 Гбайт памяти DDR4-2400 ECC, что позволяет запускать специализированные приложения, например, MetaMux и MetaWatch (низколатентная агрегация и прецизионные временные отметки). Программное обеспечение хранится на отдельном твердотельном накопителе объёмом 120 Гбайт, при этом, имеется ещё и вспомогательный управляющий x86-процессор Intel, обеспечивающий работу фирменной операционной системы EOS.

 Arista 7130B: детерминированное время отклика 7 нс, платформа Intel Tofino. Источник: Arista Networks

Arista 7130B: детерминированное время отклика 7 нс, платформа Intel Tofino. Источник: Arista Networks

Модель 7130B крупнее, она занимает в высоту уже 2U, все 32 10G-порта используют форм-фактор QSFP-DD, а в основе платформы лежит P4-программируемый кремний Intel Tofino. Совокупно этот коммутатор может обслуживать 256 портов с латентностью «хост-хост» в районе 7 нс. При этом 7130B использует конвейер, реализованный в серии 7170, с теми же возможностями, включающими инкапсуляцию, трансляцию адресов и балансировку нагрузки. Благодаря гибкости Tofino, дополнительный маршрутизатор не требуется. Здесь также имеется восьмиядерный процессор x86, отвечающий за работу EOS.

 Архитектура Arista 7130B. Источник: Arista Networks

Архитектура Arista 7130B. Источник: Arista Networks

В вариантах платформы Arista 7130, оснащённых программируемыми матрицами Xilinx (в зависимости от моделей, от одной до трёх, в 7130LBR их две) обеспечивается наибольшая гибкость и универсальность — поддерживаются программные модули не только самой Arista, но и сторонних разработчиков программного обеспечения; доступна также полная кастомизация. Новинки позволяют одновременно добиться повышения плотности и гибкости L1-инфраструктуры, которую при желании можно дополнить L2/L3-функциями или же реализовать собственные сценарии обработки трафика.

Не обошлось и без модных облачных технологий. Новые коммутаторы поддерживают поддерживает фирменный стек Arista CloudVision, обеспечивающий удобное управление сетью, включая гибкую оркестрацию нагрузки, автоматизацию рабочих процессов, сбор телеметрии и многое другое. Обеспечена интеграция с программными решениями сторонних разработчиков, что упрощает внедрение сетей на базе Arista 7130 в уже существующую инфраструктуру. Подробности доступны на сайте Arista.

Постоянный URL: http://servernews.ru/1067397
04.06.2022 [23:15], Игорь Осколков

AMD выделила учёным и исследователям ещё 7 Пфлопс вычислительных мощностей

AMD объявила о расширении специального фонда HPC Fund, который был создан в 2020 году для помощи в исследованиях коронавируса COVID-19. К уже имеющимся мощностям было добавлено ещё 7 Пфлопс. Таким образом, общая производительность превысила 20 Пфлопс, а рыночная стоимость предоставляемого в бесплатное пользование оборудования составила более $31 млн по состоянию на май этого года.

Теперь в рамках HPC Fund научному сообществу будут доступны не только процессоры AMD EPYC и ускорители Instinct, но и FPGA Xilinx Alveo и Versal ACAP. Обновлённая гетерогенная платформа поможет в исследованиях в таких областях, как изменение климата, здравоохранение, транспорт, Big Data и т.д. AMD предлагает облачный доступ к вычислительным мощностям глобальным университетам и исследовательским институтам, которые могут подать заявку на выделение необходимых ресурсов.

 Изображение: AMD

Изображение: AMD

На сегодняшний день AMD предоставила локальные и облачные вычислительные системы трём десяткам учреждений в восьми странах. Почти 6000 исследователей получили доступ к решениям AMD, в результате чего было опубликовано 55 научных статей, посвящённых различным вопросам — от исследования эффективности вакцинации от COVID-19 до повышения качества диагностики рака молочной железы с помощью методов глубокого обучения.

Постоянный URL: http://servernews.ru/1067306
19.05.2022 [19:50], Алексей Степин

Представлен FPGA-модуль AMD Xilinx Kria KR260 для быстрой разработки робототехники

Семейство модулей Xilinx Kria появилось ещё весной прошлого года, позиционировались новинки в качестве платформы для быстрой разработки периферийных (edge) устройств, особенно связанных с системами машинного зрения. Вчера же был представлен новый модуль Kria KR260, предназначенный специально для робототехники. По сравнению с моделью KV260 базовая плата новинки имеет расширенные возможности, особенно в части сетевой подсистемы.

Основой по-прежнему является SoM Kria K26 на базе FPGA Zynq UltraScale+, но в отличие от KV260 новая KR260 имеет не один, а два 240-контактных разъёма. Количество 1GbE-интерфейсов подросло до четырёх, причём два разъёма поддерживают индустриальную версию, а пятый Ethernet-интерфейс (10GbE) выполнен в форм-факторе SFP+. Есть поддержка TSN. Другое важное отличие — поддержка высокоскоростных модулей машинного зрения SLVS-EC (до 860 Мпикс/с) против обычных с интерфейсом MIPI.

 Источник: AMD Xilinx

Источник: AMD Xilinx

Также стоит отметить наличие большого количества разъёмов как для подключения сенсорных систем, например, лидара, так и для силовых ключей, обслуживающих приводы. Платформа реализует полностью предсказуемую внутреннюю сеть, а также может работать в составе кластера из нескольких плат KR260. Имеются развитые аппаратные средства для разгрузки процессоров от вспомогательных задач, вроде планировки движения или объединения сенсоров.

 Характеристики платформы Kria KR260. Источник: AMD Xilinx

Характеристики платформы Kria KR260. Источник: AMD Xilinx

Стоимость новинки довольно высока: сам модуль K26 стоит $300 в базовой версии или $420 в защищённом исполнении (от -40 до +100 °C), а плата KR260 обойдётся ещё в $349. Но это даст покупателю законченную и мощную систему, имеющую массу IO-портов и поддерживающую обработку видео сразу с нескольких HD-камер. Причём для неё уже есть магазин готовых приложений. Похоже, AMD всерьёз нацелилась на рынок робототехнических платформ, где собирается конкурировать с решениями NVIDIA Jetson.

Постоянный URL: http://servernews.ru/1066285
13.05.2022 [21:41], Алексей Степин

AMD поможет Meta* развернуть открытую 5G-инфраструктуру на базе решений Xilinx

Приобретение активов Xilinx открыло для AMD новые горизонты, порой неожиданные. Так, компания недавно заключила соглашение с Meta*, в рамках которого поможет разработать беспроводную 5G-инфраструктуру на базе Open RAN в рамках проекта Evenstar. Сама Meta* заинтересована в том, чтобы подключить к проекту свой метавселенной как можно больше пользователей, в том числе и тех, кто не имеет сегодня качественного доступа в Сеть. Сочетание технологий AMD/Xilinx поможет ей в этом начинании.

В арсенале Xilinx как раз есть подходящая FPGA-матрица RFSoC DFE из серии Zynq UltraScale+, которая уже используется в составе ускорителей T1, созданных специально для нужд телеком-индустрии. Эта ПЛИС позволяет реализовать достаточно производительную для поддержи 5G-радиочасти и в то же время гибкую логику, причём в многоканальном режиме. Сейчас у AMD есть полный набор микрочипов и ПЛИС, необходимых для построения универсальных базовых станций 4G/5G.

 Изображение: AMD/Xilinx

Изображение: AMD/Xilinx

Однако это далеко не единственная инициатива Meta* в области повышения доступности широкополосного интернета. Помимо крупных инвестиций в подводные и наземные волоконно-оптически линии связи, компания разрабатывает самоорганизующеся 5G-сети Terragraph, которые, в частности, уже появились на Аляске, и развивает проект по созданию автономного робота Bombyx, способного самостоятельно прокладывать оптоволокно по линиям электропередач. Компания сейчас настолько увлечена идеей метавселенной, что даже заявила о необходимости выработки новых стандартов сетевой инфраструктуры ближайшего будущего.


* Внесена в перечень общественных объединений и религиозных организаций, в отношении которых судом принято вступившее в законную силу решение о ликвидации или запрете деятельности по основаниям, предусмотренным Федеральным законом от 25.07.2002 № 114-ФЗ «О противодействии экстремистской деятельности».

Постоянный URL: http://servernews.ru/1065921
04.05.2022 [21:29], Алексей Степин

AMD предложила внедрить в процессоры EPYC ИИ-ускорители на базе FPGA Xilinx

Модульный подход к компоновке процессоров имеет как недостатки, так и преимущества. К первым относится ограниченность межъядерной коммуникации, а ко вторым — возможность легко регулировать количество чиплетов в процессорах, предназначенных для разных сегментов рынка. AMD пошла ещё дальше — теперь чиплеты получили уникальную возможность установки дополнительного кеша сверху основного кристалла (3D V-Cache в Milan-X), а вскоре появятся и чиплеты, включающие не только ядра CPU.

В попытках сделать как можно более универсальный процессор тоже видны два подхода. Intel уповает на инструкции AVX-512, которые получили расширения VNNI для работы с актуальными ИИ-нагрузками. А вскоре к ним добавится ещё и набор AMX. Базовый набор инструкций у AMD не менялся уже достаточно давно, но будущие EPYC вскоре тоже получат возможность работы с ИИ-задачам, как раз благодаря модульной компоновке. Новые патенты AMD говорят о сочетании CPU- и FPGA-чиплетов поглощённой ранее Xilinx в одной SoC.

 Изображения: AMD (via Tom's Hardware)

Изображения: AMD (via Tom's Hardware)

Патенты покрывают два способа интеграции новых кристаллов : либо добавлением нового чиплета по соседству с другими, либо использование 3D-стекинга как в случае с 3D V-Cache. В последнем случае возникают некоторые трудности с теплоотводом при размещении ускорителей непосредственно над CPU-чиплетами, поэтому AMD предлагает устанавливать новые чипы на IO-модуль.

Новые процессоры AMD EPYC, имеющие гетерогенную чиплетную архитектуру должны увидеть свет уже в 2023 году в поколении Zen 4 в виде 5-нм платформ Genoa (до 96 ядер) и Bergamo (128 ядер). И это только начало, ведь ничто не мешает использовать и другие виды чиплетов, от GPU и DPU до специфических DSP и даже ASIC. Впрочем, скорее всего, подобные чипы будут востребованы относительно небольшим числом клиентов или вообще будут создавать на заказ, как это ранее уже произошло с Intel.

Первые гибридные процессоры Xeon с FPGA компании Altera, которую Intel в итоге купила годом позже, были анонсированы ещё в 2014 году. По неофициальным данным, эти чипы создавались для обслуживания и ускорения работы СУБД Oracle. Следующая попытка была предпринята уже в поколении Skylake-SP. Тогда появился чип Intel Xeon Gold 6138P с ПЛИС Arria 10 GX 1150, соединённой с ядрами процессора посредством UPI. Одна из сфер его применение — телекоммуникации.

Постоянный URL: http://servernews.ru/1065294
08.03.2022 [21:24], Алексей Степин

AMD и Xilinx анонсировали обновлённый ИИ-ускоритель VCK5000

Ранее ПЛИС Xilinx Versal уже обзавелись поддержкой HBM2e и на основе этой флагманской FPGA была создана платформа для инференс-систем VCK5000. Сейчас AMD анонсировала новую, существенно улучшенную версию этой платформы. Правда, речи об использовании сборок с памятью HBM не идёт, это пока прерогатива серии Alveo. Если верить заявлениям компании, новая версия в три раза производительнее первоначальной, а по общей стоимости владения (TCO) вдвое выгоднее NVIDIA T4.

Последнее неудивительно, так как T4 ведёт свою родословную от классических GPU и, неся на борту не только 320 тензорных ядер, но и 2560 ядер CUDA, не во всех задачах может похвастаться высокой энергоэффективностью. По оценкам Xilinx, VCK5000 может достигать 90 % от теоретической производительности (в Топс), а у решений NVIDIA, по словам «красных», этот показатель варьируется в пределах 34–42 %. Правда, на смену T4 приходит A2.

В основе VCK5000 лежит новейшая вариация Versal ACAP (7 нм), оптимизированная для применения в ИИ-системах. Именно на инференс-алгоритмах производительность новой версии была повышена в 3 раза. AMD говорит, что в новой версии удалось минимизировать простой логических блоков в ожидании данных из памяти, практически избавившись от «тёмного кремния».

Ускоритель выполнен в виде полноразмерной двухслотовой платы расширения с PCIe 4.0 x8. Он имеет конфигурируемый TDP (от 75 до 225 Вт), оснащён 16 Гбайт DDR4-памяти, 100GbE-подключением (два QSFP28) и развивает до 125 Топс на INT8-операциях при частоте ядер 1,25 ГГц. Теоретическая пиковая производительность новинки составляет 145 Топс. Это сопоставимо с показателями NVIDIA T4 (130 Топс), как и цена — $2745 против $2410.

Главное предназначение AMD VCK5000 — использование в качестве тестовой платформы при разработке инференс-систем и систем цифровой обработки сигналов на базе FPGA. Но благодаря гибкости, обеспечиваемой применением FPGA, ничто не мешает использовать данный ускоритель и в других целях. Также очевидно, что с обретением активов Xilinx AMD продолжит активно развивать направление ПЛИС-ускорителей для различных задач, включая HPC.

Постоянный URL: http://servernews.ru/1061554
16.11.2021 [18:42], Алексей Степин

Xilinx представила свой самый мощный FPGA-ускоритель Alveo U55C

Ускорители на основе программируемых логических схем (FPGA) занимают нишу между специализированными ASIC и более универсальными чипами вроде GPU. Это направление продолжает активно развиваться. На конференции SC21 компания Xilinx, ведущий разработчик чипов FPGA, представила свой самый мощный ускоритель, Alveo U55C стоимостью $4395.

Если специализированный кремний экономичен, но предельно негибок, а решения вроде NVIDIA A100 в силу своей универсальности не во всём эффективны, то FPGA обладают высокой степенью гибкости и при этом достаточно экономичны и энергоэффективны, чтобы в ряде задач разработчики ЦОД и суперкомпьютеров, а также провайдеры облачных услуг обратили на них самое пристальное внимание. Серия ускорителей Xilinx Alveo в этих сегментах достаточно популярна, хотя «расплатой» за все достоинства FPGA до недавнего времени была крайне высокая сложность разработки.

На проходящей в настоящее время конференции SC21 компания представила наиболее мощный ускоритель в серии Alveo — Alveo U55C. Это укороченная однослотовая плата полной высоты с предельным TDP 150 Вт, могущая предоставить в распоряжение разработчика более 1,3 млн LUT, свыше 2,6 млн регистров и 9024 DSP, а также 16 Гбайт памяти HBM2 с пропускной способностью 460 Гбайт/с. Для подключения к хост-системе используется интерфейс PCIe x16, могущий работать либо в режиме 3.0, либо в режиме 4.0, но как два интерфейса x8. Сетевая часть представлена двумя портами QSFP28 (100 Гбит/с).

 Xilinx Vitis не потребует от разработчиков знания Verilog

Xilinx Vitis не потребует от разработчиков знания Verilog

Разработка для нового ускорителя базируется на универсальной программной платформе Xilinx Vitis, не требующей глубокого знания низкоуровневых языков описания аппаратного обеспечения. Новинка, главным образом, нацелена на рынок ЦОД и HPC, поэтому есть поддержка, например, RoCE и MPI. Xilinx отмечает, что именно в вычислительных нагрузках новый ускоритель Alveo U55C обеспечивает наивысшее соотношение производительности к цене. Как уже было сказано, к этому добавляется сравнительно невысокий уровень энергопотребления — 115 Вт в типовых условиях.

 Alveo U55C на порядок превосходит предшественника в характеристиках памяти

Alveo U55C на порядок превосходит предшественника в характеристиках памяти

Alveo U55C уже используют радиоастрономы CSIRO, работающие на телескопе Square Kilometer Array, который обслуживают 420 таких ускорителей, справляющихся с потоком данных 15 Тбит/с. Также новинкой заинтересованы автопроизводители — она отлично подходит для симуляции столкновений в Ansys LS-DYNA. А TigerGraph разработчик платформ аналитики, использует Alveo U55C для ускорения выполнения запросов — время получения ответа снизилось с минут (на CPU) до миллисекунд (на FPGA).

Постоянный URL: http://servernews.ru/1053852
18.09.2021 [12:08], Сергей Карасёв

AWS запустила инстансы VT1 на базе FPGA Xilinx Alveo U30 для транскодирования видео

Облачная платформа Amazon Web Services (AWS) сообщила о запуске инстансов Amazon EC2 VT1, предназначенных для многопоточного транскодирования видеоматериалов в режиме реального времени. Услуга, как ожидается, будет востребована среди создателей контента, стримеров и пр.

Система работает на базе FPGA-ускорителей Xilinx Alveo U30. Это карта расширения PCIe в однослотовом исполнении с энергопотреблением 40 Вт. Она способна осуществлять одновременное транскодирование до двух потоков в формате 4K со скоростью 60 к/с.

AWS заявляет, что применение ускорителей Xilinx Alveo U30 позволяет на 30 % сократить затраты в расчёте на один поток по сравнению с вычислениями на базе GPU. Если же сравнивать с обработкой на основе CPU, то выигрыш в стоимости достигает 60 % в расчёте на один поток.

Реализована поддержка кодеков H.264/AVC и H.265/HEVC. Предлагаются варианты с использованием одного, двух и восьми ускорителей Xilinx Alveo U30 с возможностью одновременной обработки соответственно 8, 16 и 64 потоков в формате 1080p60.

Постоянный URL: http://servernews.ru/1049338
Система Orphus