Материалы по тегу: marvell

11.05.2022 [21:56], Владимир Мироненко

Marvell купила разработчика CXL-решений Tanzanite для ускорения работы над компонуемой инфраструктурой

На прошлой неделе Tanzanite Silicon Solutions, Inc. совместно с Liqid и Samsung продемонстрировала первую платформу для создания CXL-пулов памяти, а уже на днях компания Marvell Technology объявила о приобретении этого разработчика. Данная сделка позволит Marvell ускорить разработку решений для компонуемой инфраструктуры. Как ожидается, сделка будет закрыта во II финансовом квартале 2022 года.

Основанная в 2020 году компания Tanzanite была одной из первых на развивающемся рынке CXL-решений, в первую очередь для работы с памятью. Компания создала чип Tanzanite Smart Logic Interface Connector (SLICTZ), который позволяет создать CXL-фабрику для работы с многоуровневыми пулами памяти, причём с минимальной задержкой.. С момента своего появления технология получила поддержку более 190 поставщиков, включая Intel, AMD, IBM и NVIDIA.

 Источник изображения: Marvell Technology

Источник изображения: Marvell Technology

Marvell прогнозирует, что в будущем вычислительные ресурсы, память и хранилища будут дезагрегированы в отдельные блоки, с возможностью компоновки по запросу. Компания считает, что CXL-решения Tanzanite будут играть ключевую роль в достижении этой цели. Интерес Marvell к Tanzanite в первую очередь связан с возможностью формирования более гибкой архитектуры памяти, поскольку требования к её объёму и скорости постоянно растут, а «привязка» DRAM-контроллеров к CPU/GPU не позволяет достичь нужной плотности размещения данных.

Tanzanite же уже сейчас позволяет формировать пулы объёмом до 80 Тбайт с задержкой доступа ниже, чем у типичного двухсокетного сервера. При этом каждый хост может получить пропускную способность, эквивалентную 32 каналам DDR4 или 16 каналам DDR5. Впрочем, для Marvell применение данной технологии не ограничивается только памятью — ускорители CXL будут интегрированы в широкий спектр продуктов, включая блоки обработки данных и системы хранения.

Одной из самых больших проблем, стоящих перед CXL, является расширение её использования за пределы серверного шасси, что необходимо для формирования полноценной компонуемой инфраструктуры. Применение Ethernet в качестве интерконнекта является нецелесообразным из-за больших задержек. А вот CXL-фабрики для этой задачи подходят идеально. Однако Marvell всё равно придётся решать задачи масштабирования таких фабрик за пределы стойки.

Постоянный URL: http://www.servernews.ru/1065725
19.04.2022 [14:01], Сергей Карасёв

QNAP выпустила сетевое хранилище TS-435XeU с чипом Marvell и поддержкой 2.5GbE/10GbE

Компания QNAP Systems анонсировала сетевое хранилище данных TS-435XeU для корпоративного сектора. NAS-устройство выполнено в формате 1U и рассчитано на монтаж в стойку, а габариты составляют 43,3 × 430 × 292,12 мм.

Допускается установка четырёх накопителей LFF или SFF с интерфейсом SATA 3.0. Поддерживается «горячая» замена. Кроме того, есть два коннектора для твердотельных модулей M.2 2280 с интерфейсом PCIe 3.0 x1.

 Источник изображений: QNAP Systems

Источник изображений: QNAP Systems

Применён процессор Marvell OCTEON TX2 CN9130/CN9131 с четырьмя вычислительными ядрами на архитектуре Armv8. Максимальная тактовая частота составляет 2,2 ГГц.

Поддерживается до 32 Гбайт оперативной памяти DDR4. В оснащение входят два сетевых порта 2.5GbE и два порта 10GbE SFP+. Кроме того, присутствуют по два разъёма USB 3.2 Gen 1 и USB 2.0.

Задействовано воздушное охлаждение с тремя вентиляторами диаметром 40 мм. Диапазон рабочих температур простирается от 0 до +40 °C. Весит хранилище 4,17 кг без установленных накопителей.

Постоянный URL: http://www.servernews.ru/1064233
30.06.2021 [22:44], Алексей Степин

Marvell анонсировала 5-нм DPU Octeon 10: 36 ядер ARM Neoverse N2, 400GbE, PCIe 5.0 и DDR5

Концепция ускорителя для работы с данными, выделенного DPU, продолжает набирать популярность. В последнее время целый ряд компаний представил свои решения. А на днях очередь дошла до крупного разработчика микроэлектроники, компании Marvell, которая анонсировала DPU серии Octeon 10.

Новые сопроцессоры построены на основе наиболее совершенного 5-нм техпроцесса TSMC и должны на равных сражаться с такими соперниками, как ускорители NVIDIA BlueField. Сама Marvell известна разработкой собственных вычислительных ядер, однако в Octeon 10 от этого подхода компания отошла, вернувшись к лицензированию ядер ARM — в основу новой серии чипов легли ядра Neoverse N2.

В основе данной архитектуры лежит набор команд ARM v9, появившийся не так уж давно. В сравнении с решениями на базе ARM v8.x эта архитектура может обеспечивать до 40% прироста в производительности, в том числе, за счёт поддержки 128-битных векторных расширений SVE2 и развитой подсистемы кешей. Процессорные ядра в Octeon 10 располагают по 1 и 2 Мбайт кешей второго и третьего уровня на каждое ядро.

В составе новой SoC также присутствуют блоки ускорения сетевых задач и криптографические акселераторы. Кроме этого, кремний Octeon 10 получил и сетевой коммутатор, обеспечивающий работу 16 портов Ethernet со скоростью 50 Гбит/с. «Прокормить» столь требовательную «семью» непросто, но в плане подсистем ввода-вывода новые DPU также отвечают современным реалиям: они рассчитаны на работу с памятью DDR5-5200 и поддерживают интерфейс PCI Express 5.0, блоки SerDes относятся к поколению 56G.

Отдельного упоминания заслуживает движок векторной обработки пакетов (Vector Packet Processing Engine), способный объединять в единую серию сетевые пакеты и «переваривать» их одновременно, как векторные данные. Такой подход позволяет серьёзно снизить латентность, что для DPU очень важно. Имеются в составе Octeon 10 и средства для работы с алгоритмами машинного обучения, причём каждый «тайл», поддерживающий INT8 и FP16, имеет свой объём SRAM.

Пока семейство Octeon 10 представлено четырьмя моделями, младшая из которых может содержать до 8 ядер Neoverse N2, а старшая — до 36 таких ядер, причём о масштабировании подсистемы памяти разработчики также подумали и число контроллеров DDR5 в новых чипах варьируется от 2 до 12. Несмотря на столь солидные характеристики, теплопакеты удалось удержать в разумных рамках, и даже у наиболее мощной версии DPU400 TDP составляет всего 60 Ватт.

В настоящее время Marvell Octeon 10 уже находится в производстве, первые же партии новых чипов должны поступить к заказчикам во второй половине этого года. Столь многогранные DPU должны найти применение в самых разных сценариях, от поддержания инфраструктуры 5G RAN до работы в составе облачных систем, а также в высокопроизводительных маршрутизаторах.

Постоянный URL: http://www.servernews.ru/1043235
18.08.2020 [22:16], Алексей Степин

Серверные ARM-процессоры Marvell ThunderX3: 60 ядер в SCM, 96 ядер в MCM, SMT4 в подарок

Последние дни оказались богатыми на анонсы новых процессоров. Компания IBM представила новейшие POWER10 с поддержкой памяти OMI DDR5 и PCI Express 5.0, Intel анонсировала Xeon Ice Lake-SP, которые, наконец, получили поддержку PCIe 4.0. Третьей в этом списке можно назвать Marvell, которая на мероприятии Hot Chips 32 рассказала подробности о последнем, третьем поколении ARM-процессоров ThunderX, формально анонсированном ещё весной этого года.

 Источник изображений: ServeTheHome

Источник изображений: ServeTheHome

Процессоры с архитектурой ARM покорили сегмент мобильных устройств, но в последние несколько лет интереснее другая тенденция — данная архитектура ложится в основу всё новых и новых «крупных» процессоров, предназначенных для серверного применения. И как показывает практика, когда-то считавшаяся «слабой» архитектура оказывается вовсе не такой.

Она успешно соперничает с x86, особенно там, где необходима высокая плотность упаковки вычислительных мощностей и высокая энергоэффективность. Примеры AWS Graviton2 и кастомных процессоров Google тому доказательством, а разработка Fujitsu, процессор A64FX, и вовсе лежит в основе мощнейшего суперкомпьютера планеты, японского кластера Fugaku.

Одной из компаний, прилагающих серьёзные усилия к освоению серверного рынка с помощью архитектуры ARM, является Marvell. Если первые процессоры ThunderX, доставшиеся в наследство от Broadcom, сложно назвать успешным, то уже второе поколение показало себя неплохо, и, судя по всему, третье, наконец, готово к массовому внедрению. Напомним, в отличие от домашних проектов AWS и Google, процессоры ThunderX3 должны получить развитую поддержку многопоточности, на уровне SMT4, что больше, чем у x86, но меньше, чем у POWER10.

При этом максимальное количество ядер у ThunderX3 впечатляет. Теперь известно, что о 96 ядрах речь идёт только в двухкристалльной компоновке (этим подход Marvell напоминает IBM POWER10, также существующий в двух вариантах). Один кристалл может нести до 60 ядер, что меньше, чем у Graviton2, но, во-первых, ненамного, а во-вторых, с лихвой компенсируется наличием SMT. SMT4 может дать 240 или 384 потока в зависимости от версии, и наверняка это понравится крупным облачным провайдерам, поскольку позволит разместить беспрецедентное количество VM в рамках одного сокета.

Однопоточная производительность не осталась без внимания. Компания заявила о 30% превосходстве над ThunderX2 в пересчёте на поток. В целом же, третье поколение ThunderX должно быть в 2-3 раза быстрее второго. Архитектурно процессор основывается на наборе инструкций ARM v8.3, однако сказано о частичной поддержке ARM v8.4/8.5.

В споре о том, что эффективнее для связи ядер между собой, кольцевые шины или единая mesh-сеть, единого мнения нет. Intel предпочитает первый подход, но Marvell остановила свой выбор на втором. Как обычно, на внешнем кольце расположены кеш (80 Мбайт L3 на кристалл), блоки управление питанием, а также контроллеры памяти, PCI Express и межпроцессорной шины (в данном случае CCPI).

Поддержка SMT4 реализована полностью аппаратно. С точки зрения операционной системы каждый поток ThunderX3 выглядит, как обычный процессор с архитектурой ARM. При этом реализация столь развитой многопоточности привела всего лишь к 5% увеличению площади кристалла в сравнении с однопоточной реализацией.

Разделение ресурсов ядра у нового процессора динамическое, осуществляется оно в четырёх точках: выборка, когда потока с меньшим количеством инструкций получают более высокий приоритет; выполнение, работающее по такому же принципу; планирование, которое базируется на «возрасте» потока; наконец, «отставка» — здесь приоритет получают потоки с наибольшим количеством инструкций. Оптимизация многопоточности позволяет Marvell говорить о практически линейной масштабируемости новых процессоров, по крайней мере, в пределах одного разъёма. В зависимости от числа инструкций на ядро коэффициент прироста может варьироваться от x1,28 до 2,21.

Подсистема ввода-вывода у новинок достаточно развитая. Контроллер памяти имеет 8 каналов и поддерживает DDR4-3200. За поддержку PCI Express отвечают 16 раздельных контроллеров, поддерживающих четвёртую версию стандарта. Это должно обеспечивать высокий уровень производительности при подключении 16 NVMe-накопителей, на каждый из которых придётся по четыре линии PCIe.

Заявлено о «тонком» управлении питанием, но деталей Marvell не приводит и остаётся только догадываться, насколько эта подсистема ThunderX3 продвинута. Производится новый процессор на мощностях TSMC с использованием техпроцесса 7 нм. Версия с одним 60-ядерным кристаллом выйдет на рынок уже в этом году, а вариант с двумя кристаллами и большим общим количеством ядер начнет поставляться позже, в 2021 году. Компания уже работает над ThunderX4, ожидается что эти процессоры будут использовать техпроцесс 5 нм и увидят свет в 2022 году.

Постоянный URL: http://www.servernews.ru/1018552
Система Orphus