Материалы по тегу: xilinx

04.10.2018 [13:02], Геннадий Детинич

Xilinx анонсировала гибридные FPGA/SoC-ускорители для любых задач

Представленная в марте работа компании Xilinx над проектом Everest вылилась на днях в анонс новой архитектуры Versal и продуктов на её основе. Разработка решений ведётся в рамках развития новой гетерогенной платформы компании для ускорителей с поддержкой адаптивных вычислений или ACAP (Adaptive Computer Accelerator Platform). В новых ПЛИС программируемым вентилям отводится всё меньше места, тогда как ядрам ARM, DSP и ИИ-ускорителям на кристаллах выделяются всё возрастающие площади. Это уже не просто FPGA, это фактически однокристальные сборки или SoC с элементами FPGA.

Xilinx

Xilinx

Решения поколения Versal разделены в шесть продуктовых серий или семейств, каждое из которых ориентировано на свою сферу применения. Первыми в 2019 году выйдут 7-нм продукты семейств AI Core и Prime. Продукты AI Core будут использоваться в системах машинного обучения с функцией принятия решений. Продукты Prime займут нишу ускорителей расчётов в центрах по обработке данных. В последующие годы появятся серии AI Edge, AI RF, Premium и HBM, с позиционированием которых можно ознакомится по таблице ниже.

Xilinx

Xilinx

По большому счёту, новые решения Xilinx должны и будут конкурировать с гибридными решениями Intel в виде ускорителей на FPGA-матрицах бывшей компании Altera. Разница только в том, что в паре с FPGA Altera компания Intel продвигает процессоры Xeon, а Xilinx — ядра ARM. Другие составные части платформ обеих компаний — это специализированные ИИ-движки, в чём они примерно равны (у Intel — это решения Mobileye, у Xilinx — свой движок, о котором ниже). Тем самым отличия будут лежать в обслуживающих ядрах, где у ARM в заявленной нише ускорителей есть определённое преимущество. Но это не мешает Xilinx открыто противопоставлять Versal как x86-совместимым процессорам, так и актуальным графическим процессорам.

По словам Xilinx, продукты Versal в области распознавания изображений в 43 раза превосходят процессоры Intel Xeon Platinum и от двух до восьми раз опережают ускоритель NVIDIA Tesla V100, а также в пять раз производительнее ускорителя на обычной FPGA. Более того, в задачах финансового анализа, секвенции генома и в поддержке Elasticsearch продукты Versal опережают процессоры в 89, 90 и в 91 раз.

Xilinx

Xilinx

Чуть подробнее о продуктах семейства AI Core. Помимо двух ядер ARM Cortex-A72 и двух ядер ARM Cortex-R5 они будут нести 256 Кбайт встроенной памяти и свыше 1900 DSP для обслуживания вычислений с плавающей запятой. Абсолютным новшеством станет интеграция в решения новых векторных ускорителей или AI Engines. Таковых будет в чипе от 128 штук до 400 штук и все они будут связаны внутричиповой сетью network-on-chip (NoC) с пропускной способностью в несколько терабит в секунду. Внешние интерфейсы решения будут представлены PCIe Gen4 x8 и x16, CCIX, 32G SerDes и от двух до четырёх встроенных контроллеров памяти DDR4. Флагман семейства AI Core обеспечит производительность в 147 TOPs на нагрузке INT8. Для сравнения, NVIDIA Tesla T4 обеспечивает 130 INT8 TOPs.

Продукты Versal Prime будут лишены ИИ-движков и нацелены на нагрузку общего назначения, такую как обработка изображений медицинского назначения, обслуживание сетей и систем хранения данных, систем управления в авиации и тестовое коммуникационное оборудование. Вместо ИИ-ускорителей Versal Prime получат 3080 DSP и несколько большее число программируемых вентилей.

Xilinx

Xilinx

Ещё одной отличительной особенностью поддержки новых ПЛИС станет ориентация на языки программирования верхних уровней — C, C++ и Python. По мнению Xilinx, это упростит работу с новой платформой.

Постоянный URL: http://servernews.ru/976339
03.10.2018 [23:23], Андрей Созинов

AMD и Xilinx создали систему с рекордной производительностью в задачах ИИ

Сегодня Xilinx в рамках проводимого компанией форума для разработчиков рассказала о рекордной производительности системы, построенной на ускорителях вычислений собственной разработки Alveo и центральных процессорах AMD EPYC.

Представленная система использует два 32-ядерных процессора AMD EPYC 7551 и восемь новейших ускорителей вычислений Xilinx Alveo U250, построенных на базе матриц FPGA. Данная система, по словам разработчиков, установила абсолютный рекорд, продемонстрировав производительность в обработке 30 000 изображений в секунду в нейронной сети GoogLeNet. Иначе говоря, искусственный интеллект с помощью этой системы смог распознать 30 000 изображений всего за одну секунду.

Ускорители вычислений Xilinx Alveo U250 построены на матрицах UltraScale+ FPGA. Использование программируемых матриц обеспечивает этим ускорителям гораздо более широкое применение, нежели графическим процессорам и специализированным ASIC. По сути, это универсальное решение для самых разных вычислительных нагрузок. И конечно же, эти чипы способны обеспечить гораздо большую производительность, нежели центральные процессоры.

Также было отмечено, что процессоры AMD EPYC как нельзя лучше подходят для систем искусственного интеллекта. В первую очередь, это обусловлено наличием у каждого из них до 128 линий PCI Express 3.0, что позволяет подключить множество ускорителей вычислений, не ограничивая их в числе линий. Кроме того, эти процессоры предлагают до 32 ядер, 64 потоков, способны принять до 2 Тбайт оперативной памяти и обладают встроенным процессором безопасности.

Xilinx и AMD планируют продолжать технологическое сотрудничество. В планы компаний входит создание систем на базе процессоров EPYC ускорителей вычислений на основе графических процессоров AMD и, собственно, ускорителей вычислений Xilinx, как нынешних Alveo, так и будущих Versal на базе чипов ACAP.

Постоянный URL: http://servernews.ru/976318
18.08.2018 [14:23], Геннадий Детинич

ЦОД SK Telecom получили крупнейшие в Корее массивы FPGA-матриц Xilinx

По сообщению сайта DatacenterDynamics, южнокорейский оператор связи — компания SK Telecom разместила в своих центрах по обработке данных крупнейшие в стране массивы на программируемых матрицах компании Xilinx. Матрицы Xilinx семейства Kintex UltraScale используются для работы фирменного сервиса Nugu оператора SK Telecom по распознаванию речи. Это работа одноимённых смарт-колонок и облачного сервиса SK Telecom. До этого для работы системы распознавания речи оператор использовал графические адаптеры NVIDIA Titan X. Переход на матрицы Xilinx Kintex UltraScale обеспечивает пятикратный прирост по производительности и шестнадцатикратный выигрыш по соотношению производительности на ватт.

Облачный сервис Nugu по распознаванию речи SK Telecom запустил в июне 2016 года, как конкурента аналогичным сервисам Amazon Echo и Google Home (или «Алисе» «Яндекса»). К апрелю 2017 года сервис записал 100 млн разговоров. После начала поставок смарт-колонок Nugu mini, интеграции Nugu в навигационные приложения SK Telecom, в детские смарт-часы компании Joon и в видеопотоковый IPTV-сервис SKT число записанных разговоров резко возросло и в феврале 2018 года достигло 1,1 млрд. В таких условиях для распознавания речи понадобилось что-то производительнее и эффективнее GPU NVIDIA.

На следующем уровне сотрудничество SK Telecom и Xilinx выльется в развёртывание нового поколения решений Xilinx с элементами искусственного интеллекта и машинного обучения. Это новая платформа ACAP компании Xilinx (Adaptive Compute Acceleration Platform или платформа для ускорителей с поддержкой адаптивных вычислений).

Постоянный URL: http://servernews.ru/974186
20.03.2018 [15:30], Геннадий Детинич

Xilinx предлагает покорять ИИ и «большие данные» с 7-нм гибридными матрицами FPGA

Компания Xilinx сделала достоянием гласности информацию о работе над проектом под кодовым именем «Project Everest». В рамках проекта создаётся платформа, которую назвали ACAP (Adaptive Compute Acceleration Platform; по-русски: платформа для ускорителей с поддержкой адаптивных вычислений). По замыслу Xilinx, аппаратные ускорители расчётов в центрах по обработке данных, будь то центральные процессоры или специализированные ускорители, должны автоматически адаптироваться к актуальной рабочей нагрузке подобно программному обеспечению.

Блок-схема гибридных FPGA матриц Xilinx Project Everest (Xilinx)

Блок-схема гибридных FPGA матриц Xilinx Project Everest (Xilinx)

Платформа Xilinx Project Everest будет сочетать высокопроизводительную логику компании нового поколения, прикладной процессор, процессор для обработки данных в реальном масштабе времени, один или два программируемых вычислительных «движка», блок для работы с радиочастотными компонентами, высокоскоростные преобразователи SerDes, программируемые интерфейсы ввода/вывода, контроллер памяти HBM и ряд других блоков и интерфейсов, и всё это будет связано внутренней высокоскоростной шиной.

На разработку платформы ACAP компания Xilinx потратила свыше $1 млрд. Проектом Everest в течение 4 лет занимались 1500 инженеров компании. Цифровой проект для передачи в производство будет готов позже в текущем году. Изготавливать чипы Project Everest будет компания TSMC в рамках 7-нм техпроцесса. Поставки намечены на 2019 год. Финальный чип будет представлять собой комбинацию из нескольких кристаллов на общей подложке с огромным даже по современным меркам числом транзисторов — свыше 50 млрд штук.

Преимущества платформы ACAP Xilinx (рост скорости расчётов на «новых» нагрузках до 100 крат)

Преимущества платформы ACAP Xilinx (рост скорости расчётов на «новых» нагрузках до 100 крат)

По словам разработчика, скорость перепрограммирования блоков платформы Project Everest будет на уровне миллисекунд. Это сделает ускорители на основе ACAP от 10 до 100 раз эффективнее по сравнению с центральными и графическими процессорами в случае обработки данных на таких новых направлениях, как «большие данные» и искусственный интеллект. Сюда же можно добавить машинное зрение, распознавание речи, поиск, принятие решений ИИ и многое другое, с чем процессоры общего назначения справляются с большими затратами ресурсов.

Программная поддержка платформы Xilinx ACAP

Программная поддержка платформы Xilinx ACAP

Кроме того, компания Xilinx обещает сделать программирование для гибридных матриц не сложнее, например, программирования для графических процессоров. Для ACAP будут доступны инструменты подобные C/C++, OpenCL и Python. Это понизит или сотрёт барьер между обычными программистами и специалистами по работе с матрицами FPGA. В Xilinx возлагают массу надежд на новую платформу, расценивая её как один из трёх важнейших направлений в развитии компании.

Постоянный URL: http://servernews.ru/967228
12.09.2017 [14:47], Константин Ходаковский

Xilinx, ARM, Cadence и TSMC создадут тестовый 7-нм чип

Компании Xilinx, ARM, Cadence Design Systems и TSMC сообщили о сотрудничестве с целью создания в 2018 году первого тестового CCIX-чипа на базе 7-нм FinFET норм TSMC. Этот чип будет призван продемонстрировать возможности платформы CCIX (Cache Coherent Interconnect for Accelerators) в деле эффективного взаимодействия многоядерных высокопроизводительных процессоров ARM с FPGA-ускорителями, находящимися за пределами основного кристалла.

Тестовый чип будет основан на последней технологии внутрисистемного соединения ARM DynamIQ и использовать шину CMN-600. Cadence предоставит ключевые блоки ввода-вывода и подсистемы памяти, включая CCIX-решение (контроллер и PHY), PCI Express 4.0/3.0 (контроллер и PHY), DDR4 PHY, периферийные блоки вроде I2C, SPI и QSPI, а также драйверы. Инструменты проектирования Cadence будут применены и при создании тестового чипа, который чип объединит CPU ARM с 16-нм FPGA-чипами Virtex UltraScale+ от Xilinx через протокол связи CCIX.

Согласно совместному заявлению компаний, финальной стадии разработки Tape-out чип должен достичь в первой четверти 2018 года, а полноценные кристаллы будут выпущены во второй половине того же года. Этот дизайн призван продемонстрировать, как последние процессоры ARM могут эффективно взаимодействовать с когерентными многочиповыми ускорителями в масштабе ЦОД, а также решить проблему быстрого и простого доступа к данным.

Подобные решения помогут в будущем создать высокопроизводительные и при этом эффективные платформы для центров обработки данных. TSMC отметила, что 7-нм нормы FinFET — самый совершенный техпроцесс компании, который позволит добиться преимуществ как с точки зрения роста производительности, так и энергоэффективности.

Постоянный URL: http://servernews.ru/958375
20.07.2017 [11:55], Сергей Карасёв

Одноплатные компьютеры Z-Turn Lite полагаются на программируемую платформу Xilinx

Компания MYiR Tech представила две версии одноплатного компьютера Z-Turn Lite для разработчиков, поставки которого начнутся 11 августа.

Особенностью новинок является применение программируемой однокристальной системы Xilinx. Так, младшая версия Z-Turn Lite использует модуль Zynq-7007S, в состав которого входит одно ядро ARM Cortex A9 с частотой 667 МГц и матрица Artix-7 FPGA (23 тыс. логических вентилей). Более мощная модификация содержит решение Zynq-7010, включающее два ядра ARM Cortex A9 с частотой 667 МГц и матрицу Artix-7 FPGA (28 тыс. логических вентилей).

Одноплатные компьютеры несут на борту 512 Мбайт оперативной памяти DDR3 SDRAM. Флеш-модуль eMMC вместимостью 4 Гбайт можно дополнить картой microSD.

Оснащение включает сетевой контроллер Gigabit Ethernet, а также порт mini USB 2.0. Кроме того, предусмотрены встроенные сенсоры — трёхосный акселерометр и датчик температуры. Габариты составляют 91 × 63 мм.

Что касается цены, то младшая версия одноплатного компьютера Z-Turn Lite обойдётся примерно в 70 долларов США, старшая — в 75 долларов. 

Постоянный URL: http://servernews.ru/955747
18.10.2016 [12:08], Константин Ходаковский

Крупнейшие игроки серверного рынка представили интерфейс OpenCAPI

Возможно, кто-то помнит, как 10 лет назад AMD представила технологию Torrenza. В её основе лежала идея создания быстрого и согласованного интерфейса между CPU и различными типами ускорителей (через Hyper Transport). Это была одна из первых инициатив в деле продвижения гетерогенных вычислений.

Сегодня уже существует немало практических воплощений концепции гетерогенных вычислений — наиболее популярная предполагает ускорение высокопараллельных расчётов общего назначения при помощи GPU. Есть ускорители шифрования, сжатия, сети, но преимущества таких решений порой нивелируются необходимостью передавать данные центральному процессору и обратно, в результате чего порой куда эффективнее переложить нагрузку на CPU, добавив дополнительные инструкции.

Но сегодня времена меняются: сенсоры Интернета вещей, семантические веб-службы и обычные веб-сайты создают огромные экспоненциально растущие объёмы данных, которые не могут храниться и анализироваться обычным способом. В результате всё активнее применяется машинное обучение и анализ больших данных: всё это требует существенно большего объёма вычислений. Закон Мура в ближайшие годы полностью остановится, так что от новых техпроцессов не приходится ждать принципиальных улучшений. Вычислительные ресурсы обеспечат чипы ASIC (как в случае Google TPU), FPGA (как в проекте Microsoft Catapult) и GPU.

Все подобные ускорители нуждаются в технологии вроде Torrenza, но нового поколения — универсального скоростного и согласованного интерфейса связи с CPU. NVIDIA представила собственную такую технологию NVLink, но рынку нужен открытый стандарт, и IBM собирается поделиться своим интерфейсом CAPI с другими.

Чтобы развить это начинание, Google, AMD, Xilinx, Micron и Mellanox объединили силы с IBM в деле создания новой согласованной высокопроизводительной шины, которая получила имя Open Coherent Accelerator Processor Interface (OpenCAPI). Одна линия интерфейса обеспечивает скорость передачи данных до 25 Гбит/с. Для сравнения: спецификации PCIe 3.0 обеспечивают максимальную скорость на одну линию до 8 Гбит/с.

Уже в 2017 году интерфейс OpenCAPI появится в серверах IBM POWER9, которые, таким образом, будут поддерживать не только скоростной интерфейс для NVIDIA GPU (через NVLink), но также обеспечит более эффективную работу ускорителей Google ASIC и Xilinx FPGA. AMD тоже получит доступ к альтернативе NVLink для связи ускорителей Radeon с серверными процессорами Zen. Micron сможет подключать к CPU более скоростную память. Mellanox сможет сделать то же с сетевыми ускорителями. OpenCAPI также делает чипы FPGA привлекательными для существенно более широкого спектра приложений. Выигрывают все, кроме Intel.

К слову, Dell/EMC присоединилась к альянсу несколько дней назад, а NVIDIA является членом консорциума OpenCAPI на уровне вкладчика (как Xilinx и HP Enterprise). Интерфейс OpenCAPI может оказать существенное влияние на серверный рынок — возможно, это самый крупный анонс в секторе серверов в этом году.

Постоянный URL: http://servernews.ru/941128
04.04.2016 [14:30], Алексей Степин

Российские разработчики представили реконфигурируемую вычислительную систему на базе ПЛИС

Микросхемы ПЛИС (FPGA) являются уникальными по многим параметрам; чего стоит одна возможность программной реконфигурации внутренней схемотехники такого чипа. Причём реконфигурации под требуемую задачу, а ведь известно, что узкоспециализированные чипы решают определённого рода задачи в разы, а то и на порядки быстрее процессоров общего назначения. Нет никакой проблемы превратить ПЛИС, к примеру, в процессор цифровой обработки сигналов или даже эмулировать на ней архитектуру другого процессора, что иногда делают энтузиасты, создающие клоны любимых ретро-консолей и систем типа Amiga. Это было возможно даже на старых поколениях ПЛИС, новые же чипы этого типа представляют собой настоящих монстров производительности. Интерес к ним со стороны разработчиков суперкомпьютеров вполне логичен.

НИИ МВС и НИЦ супер-ЭВМ и нейрокомпьютеров

НИИ МВС и НИЦ супер-ЭВМ и нейрокомпьютеров

Ни для кого не секрет, что Российская Федерация нуждается в вычислительных мощностях, как и любое другое крупное государство, имеющее стратегическое влияние на высшем уровне. А в определённых отраслях нужна не просто вычислительная мощность, а мощность, максимально защищённая от атак изнутри — разработанная и проверенная собственными силами и лишённая каких-либо вредоносных «закладок». Хотя тема «закладок» и отдаёт порой изрядной параноидальностью, есть сферы, где лучше лишний раз убедиться в безопасности всего электронного оборудования. Все помят историю с вирусом Stuxnet, полностью парализовавшим иранское производство ядерного топлива и впоследствии обнаруженным даже в системах одной из российских АЭС и на компьютерах международной космической станции. Понемногу эта область вычислительной техники в России развивается: в частности, существует неплохой двухъядерный процессор Байкал-Т1 (28 нм) и более серьёзный восьмиядерный Эльбрус-8С (1,3 ГГц, 4 Мбайт L2, 16 Мбайт L, 250 Гфлопс).

Основа суперкомпьютеров и вычислительных модулей нового поколения

Основа суперкомпьютеров и вычислительных модулей нового поколения

Это процессоры общего назначения; они, несомненно, будут востребованы и найдут своё место в оборонной, аэрокосмической и научной отраслях. Но ведутся исследования и в других направлениях, связанных с вычислительной техникой. В частности, на конференции ПаВТ 2016 НИИ МВС Южного федерального университета (г. Таганрог) и Научно-исследовательский центр супер-ЭВМ и нейрокомпьютеров представили уникальную реконфигурируемую вычислительную систему на основе ПЛИС Virtex UltraScale с жидкостным охлаждением. Последний факт не удивляет: в последнее время владельцы крупных ЦОД и суперкомпьютеров по всему миру активно интересуются темой жидкостного охлаждения и внедряют соответствующие системы, как более выгодные и надёжные в эксплуатации.

Модули с воздушным охлаждением: «Плеяда» (слева) и «Тайгета»

Модули с воздушным охлаждением: «Плеяда» (слева) и «Тайгета»

Интересно, что в качестве хладагента используются не дорогостоящие высокомолекулярные составы, выпускаемые компанией 3M и ставящие отечественные системы с СЖО в зависимость от этой компании, а специальное маловязкое масло МД-4,5, обладающее подходящими параметрами, в частности, высокой теплоёмкостью на уровне 1,666 кДж/(кг·К) и низким коэффициентом объёмного расширения. Вполне на уровне и электрические характеристики: электрическая прочность 280 МВ/м и удельное сопротивление 2,2×1012 Ом. Стоит эта жидкость примерно $15 за килограмм и производится на предприятиях НПЦ Спецнефтьпродукт. Ещё один плюс к автономности и независимости от зарубежных источников. Вероятно, к ней стоит присмотреться и энтузиастам-оверклокерам, особенно тем, кто любит эксперименты.

Конструкция погружной СЖО довольно проста

Конструкция погружной СЖО довольно проста

Сами ПЛИС, разумеется, производятся Xilinx, поскольку освоение такой технологии своими силами — дело не одного года: современные ПЛИС являются чрезвычайно комплексными устройствами и расходы на их разработку (R&D) могут быть весьма солидными, а кроме того, при желании полной автономности производства потребуется постройка соответствующих фабрик, что тоже обойдётся весьма недёшево. Как показали предыдущие эксперименты с модулями «Плеяда» РВС-7 и «Тайгета» с пиковой производительностью на стойку 62 и 43‒53 терафлопса, высокая плотность компоновки модулей и плат с установленными на них микросхемами Virtex-6 или Virtex-7 подтвердили кризис систем воздушного охлаждения при высокой плотности упаковки чипов в малоразмерных корпусах. Температура ПЛИС в модуле «Тайгета» составила 72,9 градуса при допустимом диапазоне 65‒70 градусов, а модуль на базе более сложных чипов UltraScale и вовсе продемонстрировал 85 градусов, что уже угрожало работоспособности ПЛИС.

Вся хитрость —  в правильной подаче хладагента

Вся хитрость —  в правильной подаче хладагента

В итоге была разработана новая компоновка вычислительных ПЛИС-модулей, изначально рассчитанная на применение жидкостного охлаждения с помощью промышленных холодильных установок (чиллеров), тепловой поток к которым должны передавать специальные теплообменники, установленные в каждом модуле. За стандарт был взят форм-фактор шасси высотой 3U для установки в стандартные 19-дюймовые шкафы с расчётом не менее 12 модулей на шкаф. При этом каждый модуль несёт в себе от 12 до 16 плат с 8 ПЛИС, каждая из которых генерирует тепловой поток 100 ватт. Конструкция модуля делится на 2 зоны — вычислительную и теплообменную. В последней установлен автономный циркуляционный насос и высокоэффективный пластинчатый теплообменник, подключаемый к общей чиллер-системе, а также краны на случай аварии или необходимости замены модуля.

Испытательный стенд теплового макета

Испытательный стенд теплового макета

Вычислительная секция состоит из 12 плат ПВМ, трёх модулей питания, модулей загрузки и управления, платы индикации, а также кросс-платы питания, загрузки. Как уже было сказано, каждая плата вычислительного модуля несёт на себе 8 ПЛИС Kintex UltraScale XCKU095. Это предпоследняя модель в серии 20-нанометровых ПЛИС Kintex, содержащая в себе 1176 логических ячеек, 768 частей DSP, 59,1 Мбайт блочной памяти, 64 трансивера со скоростью передачи данных 16,3 Гбит/с и располагающая 702 линиями ввода/вывода. Кроме ПЛИС на плате содержится оперативная память, флеш-память для загрузки, тактовый генератор с необходимой обвязкой и преобразователи подсистемы питания. Не вполне понятно, почему разработчики выбрали стандарт 12 вольт. Они не были привязаны к существующей инфраструктуре и вполне могли позволить себе эксперименты с более высокими напряжениями, например, 48 вольт — именно этим сейчас занимаются Intel и Google.

Компоновка вычислительного модуля

Компоновка вычислительного модуля

Любопытно, что в модуле загрузки и управления не обошлось без Intel: в нём может быть установлен любой процессор семейства Broadwell-U, соединённый с ПЛИС Xilinx седьмой серии, которая, в свою очередь, уже общается с остальными платами посредством интерфейсов LVDS/MGT и RS-422. Эта же микросхема отвечает за индикацию и управление насосной группой СЖО. Типовой модуль питания предназначен для подключения к сетям с напряжением 380 вольт и имеет четыре выходных канала по 12 вольт с нагрузочной способностью 80 ампер на канал. Вся вычислительная зона является герметичной, поскольку используется погружная концепция СЖО, не требующая установки теплообменника на каждый греющийся элемент. Такая система содержит меньше соединительных элементов, требующих герметичности, проще в обслуживании и в целом надёжнее, хотя её эксплуатация и сопряжена с некоторыми неудобствами: не слишком-то приятно вынимать из ремонтируемого модуля платы, покрытые слоем охлаждающего масла.

Компоновка модуля управления

Компоновка модуля управления

Второй, общий контур системы охлаждения является водяным. Применение эффективных теплообменников позволило добиться ситуации, когда даже под нагрузкой средняя температура корпуса ПЛИС составила от 50,3 до 52,6 градусов в зависимости от модели. Температура хладагента при этом не поднималась выше 19,3 градусов. Таким образом, прототип нового вычислительного модуля был успешно испытан и проведённые эксперименты доказали, что погружная система охлаждения работоспособна и в состоянии отвести до 12 киловатт тепла. Блоки питания тоже не подкачали и смогли обеспечить эффективность до 89 %. Похоже, им смело можно присваивать сертификат не ниже 80 PLUS Silver. Также доказали свою эффективность при обмене данными между ПЛИС интегрированные в них высокоскоростные трансиверы последнего поколения: в пределах модуля проблемы «бутылочного горлышка» не наблюдалось.

Образец модуля «Скат». Хорошо видны особенности системы охлаждения

Образец модуля «Скат». Хорошо видны особенности системы охлаждения

Новый вычислительный модуль получил название «Скат». Хотя внешне он выглядит абсолютно непримечательно — как обычный серверный корпус формата 3U, внутри расположена высокоэффективная жидкостная система охлаждения погружного типа, обеспечивающая гидравлический «обдув» важных компонентов. При полной компоновке с использованием шкафа 47U 12 модулей «Скат» могут обеспечить пиковую производительность на уровне 1 петафлопса при общей потребляемой мощности 154 киловатта. Для сравнения, суперкомпьютер IBM Roadrunner, введённый в строй в 2008 году при сопоставимой вычислительной производительности занимает площадь около 1100 квадратных метров, весит 226 тонн и потребляет 3,9 мегаватта электроэнергии. Отечественный «Ломоносов» при пиковой мощности 1,7 петафлопс занимает 252 квадратных метра и потребляет 2,8 мегаватта электроэнергии. Преимущества архитектуры «Скат», таким образом, очевидны.

Стандарный вычислительный узел с 12 модулями «Скат»

Стандартный вычислительный узел с 12 модулями «Скат»

Использование единой холодильной системы легко позволяет собирать из таких шкафов вычислительную систему любой необходимой мощности. Тут возникает вопрос «бутылочного горлышка» при обмене данными между шкафами, но эта проблема, вероятно уже решена разработчиками и соответствующие интерфейсы (100GbE или 290GbE EDR Infiniband) входят в состав системы. Конечно, новые суперкомпьютерные модули используют ПЛИС зарубежного производства, но доля вложенного в их проектирование и отладку труда столь велика, что их вполне можно считать отечественными. «Скат» вполне можно считать одной из самых удачных разработок в мире реконфигурируемых суперкомпьютеров; во всяком случае в этой конструкции, достигнута непревзойдённая плотность упаковки вычислительных узлов и высочайшая эффективность охлаждения. Вполне возможно, что именно за ПЛИС-системами — будущее супервычислений: никакая другая архитектура не может предложить сравнимого уровня гибкости конфигурации. Системы, разработанные в НИИ МВС, уже используются в ряде ведомств РФ.

Постоянный URL: http://servernews.ru/930949
17.07.2013 [01:08], Георгий Орлов

Xilinx выпустила первые устройства по процессу 20 нм

До сих пор внедрение компанией Xilinx новых технологических процессов распространялось на всю линейку программируемых логических устройств. Так, когда Xilinx освоила технологию 28 нм, она выпустила семейство продуктов Artix в самом маленьком форм-факторе, Kintex с наилучшим соотношением цена/производительность, топовый Virtex, а также расширяемую SoC-платформу Zynq.

Xilinx

Теперь Xilinx объявила о выпуске двух «пионерных инноваций в индустрии» - первых полупроводниковых устройств и программируемых решений, выполненных по технологии TSMC 20 нм. Xilinx также разработала первую в отрасли программируемую архитектуру ASIC-класса, называемую UltraScale. Интересным моментом является то, что только Zynq, Kintex и Virtex переходят на 20 нм процесс и архитектуру UltraScale — семейство Artix останется на 28 нм в обозримом будущем.

В дальнейшем, когда Xilinx перейдёт от 20 нм к 16 нм FinFET («FinFast») процессу, вполне возможно, что только семейство Virtex получит шанс продолжить жизнь на 16 нм, что в корне отличается от распространённой политики поддержки унаследованных и устаревших продуктов - в программируемой логике только самые продвинутые продукты каждого семейства реализуются на новой технологии.

Материалы по теме:

Источник:

Постоянный URL: http://servernews.ru/597580
Система Orphus