Материалы по тегу: pci express 5.0

29.08.2022 [18:34], Алексей Степин

AMD представила DPU-платформу 400G Adaptive Exotic SmartNIC

На конференция Hot Chips 34 AMD представила новую платформу 400G Adaptive Exotic SmartNIC. В самой концепции формально нет ничего нового, поскольку DPU уже снискали популярность в среде гиперскейлеров, но вариант AMD сочетает достоинства не двух, а трёх миров: классического ASIC, программируемой логики на базе FPGA и Arm-процессора общего назначения.

На деле процессор (PSX) новинки AMD устроен ещё интереснее: он делится на два домена. В первом домене имеется шестнадцать ядер Arm Cortex-A78, организованных в четыре кластера по четыре ядра. Сюда же входят аппаратные движки для ускорения TLS 1.3. Второй домен состоит из четырёх ядер Arm Cortex-R52 и различных контроллеров низкоскоростных шин, таких как UART, USB 2.0, I2C/I3C, SPI, MIO и прочих.

 Изображения: AMD (via ServeTheHome)

Изображения: AMD (via ServeTheHome)

Посредством высокоскоростной программируемой внутренней шины блок PSX соединён с другими компонентами: модулем взаимодействия с хост-системой (CPM5N), подсистемой памяти, сетевым модулем HNICX и блоком программируемой логики. CPM5N реализует поддержку PCIe 5.0/CXL 2.0, причём доступен режим работы в качестве корневого (root) комплекса PCIe. Тут же находится настраиваемый DMA-движок.

Блок фиксированных сетевых функций представляет собой классический ASIC, обслуживающий пару портов 200GbE. Подсистема памяти представлена 8 каналами DDR5/LPDDR5 с поддержкой 32-бит DDR5-5600 ECC или 160-бит LPDDR5-6400, но говорится и совместимости с другими вариантами памяти, в то числе SCM. Здесь же имеется блок шифрования содержимого памяти с поддержкой стандартов AES-GCM/AES-XTS.

400G Adaptive Exotic SmartNIC имеет развитую поддержку VirtIO и OVS. Также поддерживается виртуализация NVMe-устройств, тоже с шифрованием. Особое внимание AMD уделила тесному взаимодействию всех частей Adaptive Exotic SmartNIC: наличие выделенных линков между блоками хост-контроллера, PSX и FPGA обеспечивает работу на полной скорости в средах, действительно требующих прокачки данных на скоростях в районе 400 Гбит/с.

Благодаря наличию FPGA-части 400G новинка можно легко адаптировать к новым требованиям со стороны заказчиков. В частности, решения на базе ПЛИС Xilinx активно поставляются в Китай, где требования к шифрованию существенно отличаются от предъявляемых к аппаратному обеспечению в Европе или США, но наличие блока FPGA позволяет решить эту проблему. У Intel уже есть в сём-то похожая платформа, но более скромная по техническим характеристикам — Oak Springs Canyon (C6000X).

Постоянный URL: http://servernews.ru/1072858
09.08.2022 [18:09], Игорь Осколков

Китайская компания Biren представила ИИ-ускоритель BR100, который обгоняет по производительности NVIDIA A100

Шанхайская компания Biren Technology, основанная в 2019 году и уже получившая более $280 млн инвестиций, официально представила серию ускорителей BR100, которые способные потягаться с актуальными решениями от западных IT-гигантов. Утверждается, что это первое изделие подобного класса, созданное в Поднебесной. Компания уже подписала соглашение о сотрудничестве с ведущим производителем серверов Inspur.

Новинка содержит 77 млрд транзисторов, использует чиплетную компоновку, изготавливается по 7-нм техпроцессу на TSMC и имеет 2.5D-упаковку CoWoS. Для сравнения — грядущие NVIDIA H100 имеют такую же упаковку, но включают 80 млрд транзисторов и изготавливаются по более современному техпроцессу TSMC N4. При этом BR100 примерно вдвое производительнее 7-нм NVIDIA A100 и примерно вдвое же медленнее H100. Впрочем, Biren приводит только данные о вычислениях пониженной точности, да и в целом говорит о том, что новинка предназначена в первую очередь для ИИ-нагрузок.

 Изображения: Biren

Изображения: Biren

В серию входят два решения: BR100 и BR104. Оба варианта оснащаются интерфейсом PCIe 5.0 x16 с поддержкой CXL. Первый вариант имеет OAM-исполнение с TDP на уровне 550 Вт. Он позволяет объединить до восьми ускорителей на UBB-плате, связав их между собой фирменным интерконнектом BLink (512 Гбайт/с) по схеме каждый-с-каждым. BR100 полагается 300 Мбайт кеш-памяти и 64 Гбайт HBM2e (4096 бит, 1,64 Тбайт/c).

 BR100

BR100

Также он способен одновременно кодировать до 64 потоков FullHD@30 HEVC/H.264, а декодировать — до 512. Кроме того, доступно создание до 8 аппаратно изолированных инстансов Secure Virtual Instance (SVI) по аналогии с NVIDIA MIG. Заявленная производительность составляет 256 Тфлопс для FP32-вычислений, 512 Тфлопс для TF32+ (по-видимому, подразумевается некая совместимость с фирменным форматом NVIDIA TF32), 1024 Тфлопс для BF16 и, наконец, 2048 Топс для INT8.

 BR104

BR104

BR104 представляет более традиционную FHFL-карту с TDP на уровне 300 Вт. По производительности она ровно вдвое медленнее старшей версии BR100, способна обрабатывать вдвое меньшее количество видеопотоков и предлагает только до 4 SVI-инстансов. BR104 имеет 150 Мбайт кеш-памяти, 32 Гбайт HBM2e (2048 бит, 819 Гбайт/c) и три 192-Гбайт/с интерфейса BLink. Для работы с ускорителями компания предлагает собственную программную платформу BIRENSUPA, совместимую с популярными фреймворками PyTorch, TensorFlow и PaddlePaddle.

Постоянный URL: http://servernews.ru/1071862
03.08.2022 [20:20], Алексей Степин

Microchip представила контроллеры памяти SMC 2000: два канала DDR4-3200/DDR5-4800 и 16 линий CXL

Экосистема CXL продолжает формироваться: идея дезагрегации ресурсов встретила тёплый отклик рынка, всё чаще появляются новые решения с поддержкой данного стандарта. Развивается и сам стандарт — буквально на днях были приняты и опубликованы спецификации CXL 3.0. А компания Microchip Technology представила новые контроллеры памяти с поддержкой CXL и двух каналов DDR4-3200 или DDR5-4800.

Коммутаторы и контроллеры для среды CXL компания выпускала и ранее, но серия SMC 2000 является новинкой, которая послужит мостом между памятью DDR4/DDR5 и CXL-шиной. В новой серии представлены контроллеры с конфигурацией 8×32G (PM8701) и 16×32G (PM8702), отвечающие набору спецификаций CXL 2.0 (Type 3) и 1.1. Вариант 16×32G к тому же является самым производительным в индустрии на сегодняшний день: он поддерживает сразу 16 линий CXL, способных работать на скорости 32 ГТ/с (PCIe 5.0).

 Источник: Microchip Technology

Источник: Microchip Technology

Это серьёзный шаг вперёд по сравнению с контроллером SMC 1000 первого поколения, чьи возможности были ограничены формулой 8×25G. Данный чип специально разрабатывался для модулей Open Memory Interface (OMI), но данная технология практически не «взлетела», оказавшись ограниченной рамками платформы IBM POWER. В итоге все наработки по OMI и OpenCAPI были переданы в руки консорциума CXL.

 CXL позволит легко наращивать объёмы памяти. Источник: SK hynix

CXL позволит легко наращивать объёмы памяти. Источник: SK hynix

Серию SMC 2000 явно ждёт более успешная судьба: новые чипы позволят создавать высокоскоростные двухканальные модули объёмом от 512 Гбайт. К тому же они поддерживают стекирование микросхем DRAM — до четырёх слоёв на канал. А это открывает дорогу к ещё более серьёзным объёмам. Более подробно о SMC 2000 можно узнать на сайте производителя.

Постоянный URL: http://servernews.ru/1071495
03.08.2022 [14:16], Сергей Карасёв

Tenafe представила контроллер TC2310 для серверных SSD с интерфейсом PCIe 5.0

Компания Tenafe анонсировала контроллер TC2310, предназначенный для построения твердотельных накопителей с интерфейсом PCIe 5.0 для центров обработки данных и платформ высокопроизводительных вычислений. Пробные поставки изделия начнутся во второй половине 2023 года. Кроме того, будет выпущена модификация TC2311 для клиентских SSD.

Решения позволяют использовать флеш-память TLC и QLC NAND. Реализована 8-канальная архитектура с поддержкой чипов с интерфейсом 3600 MT/s. В качестве буфера может применяться память DDR4/DDR5. Для TC2310 заявлена возможность кастомизации под нужды заказчика.

 Источник изображения: Tenafe

Источник изображения: Tenafe

На базе контроллера TC2310 будут производиться накопители в форм-факторах E1.S, E1.L, U.2, E3.S. Скорость передачи данных теоретически может достигать 14 Гбайт/с, показатель IOPS (операций ввода/вывода в секунду) — 2,5 млн. Чип TC2311 подходит для применения в высокопроизводительных клиентских накопителях типоразмера M.2 и U.2. Быстродействие достигает 14 Гбайт/с, а величина IOPS — 1,5 млн.

Обе новинки поддерживают технологию исправления ошибок LDPC (фирменный движок FlexLDPC) и средства сквозной защиты целостности данных. Могут формироваться массивы RAID из чипов памяти. Также заявлено соответствие спецификациями UNH-IOL NVMe, а для TC2310 — OCPv2.

Постоянный URL: http://servernews.ru/1071466
02.08.2022 [13:10], Сергей Карасёв

Китайская компания DapuStor представила SSD серии Haishen5 с интерфейсом PCIe 5.0 и ёмкостью до 32 Тбайт

Компания DapuStor анонсировала твердотельные накопители семейства Haishen5 для систем корпоративного класса и центров обработки данных, передаёт StorageReview. Изделия используют интерфейс PCle 5.0 x4 (спецификация NVMe 2.0). Пробные поставки накопителей компания организует в IV квартале нынешнего года. Информации об ориентировочной цене пока нет.

 Источник изображения: Storage Review

Источник изображения: Storage Review

Покупателям будут предлагаться модификации в различных исполнениях: E3.S, E1.S и U.2. Говорится о подготовке устройств на основе чипов флеш-памяти TLC и QLC NAND. В первом случае вместимость варьируется от 1,6 до 15,36 Тбайт, а во втором достигает 32 Тбайт. Задействован контроллер Marvell Bravera SC5.

Заявленная скорость последовательного чтения информации достигает 14 000 Мбайт/с, скорость последовательной записи — 8000 Мбайт/с. Величина IOPS при чтении данных блоками по 4 Кбайт составляет до 2 800 000, при записи — до 600 000. Задержки при последовательном чтении/записи заявлены на уровне 8/9 мкс.

Постоянный URL: http://servernews.ru/1071340
01.08.2022 [18:41], Игорь Осколков

SK hynix вслед за Samsung представила CXL-модули DDR5

SK hynix Inc. представила свои первые образцы DDR5-модулей в форм-факторе EDSFF E3.S. Новинки оснащены интерфейсом PCIe 5.0 x8 и контроллерами CXL 2.0. Массовое производство таких модулей начнётся в 2023 году. Одновременно компания представила и open source набор HMSDK для разработки решений на базе новой памяти. Он будет доступен в IV квартале 2022 года.

Первые образцы обладают довольно скромной ёмкостью (всего 96 Гбайт), но построены они на базе современных 24-Гбит чипов, изготовленных по техпроцессу 1α. Есть и ещё один нюанс — поскольку, по словам компании, массовых серверных платформ с поддержкой E3.S x8 всё ещё нет, некоторые образцы адаптирована для использования в имеющихся аппаратных платформах.

 Изображения: SK Hynix

Изображения: SK Hynix

Тем не менее, интерес к новинками в том или ином виде уже выразили AMD, Dell, Intel и Montage. SK hynix, как и другие участники консорциума CXL, отмечает, что гетерогенный подход к архитектуре памяти в серверах откроет возможности для создания компонуемой инфраструктуры, а также позволит гибко выбирать необходимые уровень производительности и ёмкость DRAM. Впрочем, в полном объёме вся гибкость работы с памятью будет доступна только на платформах с поддержкой CXL 2.0, которую грядущие серверные процессоры AMD и Intel предложить не смогут.

SK hynix отмечает, что даже простое сочетание DIMM и CXL-модулей в рамках одного узла позволит существенно нарастить суммарную пропускную способность DRAM — с 260–320 Гбайт/c до 360–480 Гбайт/с. Ёмкость, правда, согласно расчётам SK hynix, вырастет с 768 Гбайт до 1,15 Тбайт. Samsung же ещё этой весной анонсировала выход 512-Гбайт CXL-модулей DDR5, а в прошлом году представила платформу Poseidon V2 с поддержкой PCIe 5.0, CXL и E3.S-модулей.

Постоянный URL: http://servernews.ru/1071314
28.07.2022 [20:07], Николай Хижняк

Silicon Motion представила кастомизируемые SSD-контроллеры SM8366 и SM8308 с поддержкой PCIe 5.0 и NVMe 2.0

Компания Silicon Motion представила SM8366, свой первый 16-канальный SSD-контроллер для NVMe-накопителей с интерфейсом PCIe 5.0, а также референсную платформу MonTitan на его основе. Одновременно был анонсирован и более простой, 8-канальный контроллер SM8308. Новинки способны обеспечить скорость передачи данных более 14 Гбайт/с при последовательном чтении и записи. Производительность произвольных операций чтения и записи 4K-блоками составляет 3 и 2,8 млн IOPS соответственно.

 Изображения: Silicon Motion

Изображения: Silicon Motion

Контроллеры соответствует стандарту NVMe 2.0a, используют архитектуру Arm и выпускаются с использованием 12-нм техпроцесса. Поддерживаются чипы флеш-памяти (ONFI/Toggle) 3D NAND TLC/QLC, XL-Flash и др. со скоростью 2400 МТ/с и общим объёмом до 128 Тбайт. Возможно использование двухканальной 40-бит памяти DDR4-3200 и DDR5-4800 в качестве буфера. Интерфейс PCIe 5.0 доступен в конфигурациях x4, x2/x2 и x1/x1. Контроллеры имеют FCBGA-упаковку (21 × 21 мм) и могут использоваться в накопителях E1.S/L, E3, U.2 и U.3.

Новинки поддерживают спецификации OCP Datacenter NVMe SSD и ZNS, до 128 пространств имён и до 1024 пар запросов, шифрование AES-256, аппаратные RoT и изоляцию, аттестацию, Secure Boot и т.д. Также есть проприетарные функции PerformaShape и NANDCommand. Первая отвечает за приоритизацию, а вторая — за эффективность алгоритмов LDPC для коррекции ошибок и повышение надёжности чипов QLC и, в будущем, PLC.

Начало поставок эталонных платформ MonTitan и SDK ожидается в IV квартале 2022 года. Отличительная черта нового решения — возможность глубокой кастомизации, что актуально для гиперскейлеров, корпоративных заказчиков и производителей SSD. Например, можно настроить не только уровень производительности для отдельных операций, но и выбрать набор NVMe-функций или вынести FTL на уровень хоста. Интерес к новинке выразили Alibaba Cloud, Micron, KIOXIA, YMTC и др.

Постоянный URL: http://servernews.ru/1071077
26.07.2022 [10:56], Сергей Карасёв

Kioxia представила корпоративные SSD серии CM7 с PCIe 5.0 и NVMe 2.0

Компания Kioxia анонсировала твердотельные накопители CM7 корпоративного класса, оптимизированные для использования в высокопроизводительных и высокоэффективных серверах, а также системах хранения данных. Уже начаты отгрузки устройств некоторым заказчикам.

Изделия серии CM7 доступны в двух вариантах исполнения: EDSFF E3.S и SFF толщиной 15 мм. Задействован интерфейс PCIe 5.0 (спецификация NVMe 2.0): утверждается, что по сравнению с накопителями предыдущего поколения производительность увеличилась в два раза.

Заявленная скорость чтения информации достигает 14 Гбайт/с; скорость записи не уточняется. Заказчики смогут выбирать между устройствами с разным уровнем надёжности: 1 DWPD (полных перезаписей в сутки) и 3 DWPD. В первом случае вместимость достигает 30,72 Тбайт, во втором — 12,80 Тбайт.

 Источник изображения: Kioxia

Источник изображения: Kioxia

Накопители CM7 имеют двухпортовую конструкцию. Среди поддерживаемых функций названы SR-IOV, CMB, Multistream writes, SGL. Говорится о поддержке TCG-Opal в соответствии со стандартом FIPS 140-3. Наконец, упомянуты средства обеспечения безопасности Flash Die Failure Protection.

Постоянный URL: http://servernews.ru/1070841
15.06.2022 [16:36], Сергей Карасёв

InnoGrit начала пробные поставки SSD-контроллера Tacoma IG5669: PCIe 5.0 x4 + NVMe 2.0

Компания InnoGrit Corporation сообщила о начале пробных поставок контроллера Tacoma IG5669, предназначенного для SSD корпоративного класса. Изделие может применяться в устройствах различных форм-факторов — в частности, E1.S, E1.L, AIC, E3.S и U.2. Новинка обеспечивает поддержку интерфейса PCIe 5.0 x4 (спецификация NVMe 2.0). Возможно использование памяти различных типов, включая SLC, MLC, TLC, QLC NAND, MRAM, XL-FLASH и пр.

Говорится о 16/18 каналах NAND и о возможности примененияDDR4/LPDDR4/DDR5 в качестве буфера. Вместимость накопителей на базе Tacoma IG5669 может достигать 32 Тбайт. Обеспечено соответствие спецификациям Toggle 5.0 и ONFI 5.0. Утверждается, что скорость последовательного чтения информации будущих устройств хранения данных составит до 14 Гбайт/с, скорость последовательной записи — до 11 Гбайт/с.

 Источник изображения: InnoGrit

Источник изображения: InnoGrit

Что касается показателя IOPS (операций ввода/вывода в секунду), то он заявлен на отметке в 3 млн при произвольном чтении и 2,5 млн при произвольной записи. Среди прочего упомянут высочайший уровень защиты информации с функциями шифрования. Кроме того, реализованы средства Smart Cache и проприетарная технология коррекции ошибок ECC. Поддерживается шифрование AES, RSA, SHA3-256/384/512, SM2/3/4.

Контроллер получил многоуровневое управление питанием, поддержку SR-IOV (Single Root Input/Output Virtualization), поддержку множественных пространств имён, защиту от перегрева и поддержку различных периферийных интерфейсов, включая I3C. Кроме того, на аппаратном уровне реализована технология зонирования Zoned Namespace (ZNS) для снижения задержек и более гибких возможностей кастомизации.

Постоянный URL: http://servernews.ru/1068117
11.05.2022 [15:19], Сергей Карасёв

Samsung представила первый в мире CXL-модуль DDR5 ёмкостью 512 Гбайт

Компания Samsung Electronics сообщила о создании DDR5-модуля Compute Express Link (CXL) вместимостью 512 Гбайт — это первое в отрасли решение столь высокой ёмкости, имеющее интерфейс PCIe 5.0 и выполненное в форм-факторе E3.S. Модуль даёт возможность значительно повысить объём памяти серверных систем и увеличить её пропускную способность.

Это, в свою очередь, позволяет ускорить выполнение задач, связанных с искусственным интеллектом (ИИ) и высокопроизводительными вычислениями (HPC) в центрах обработки данных. На текущий момент Samsung уже подписала с Lenovo соглашение о развитии CXL-решений. Ожидается, что тестирование новых модулей памяти начнётся в III квартале этого года, а массовыми они станут после появления на рынке новых платформ AMD EPYC Genoa и Intel Xeon Sapphire Rapids.

 Источник изображений: Samsung

Источник изображений: Samsung

«Распространение ИИ и Big Data приводит к росту использования гетерогенных вычислений, при которых несколько процессоров работают параллельно для обработки больших объёмов данных. Открытый, обладающий широкой отраслевой поддержкой протокол CXL, основанный на интерфейсе PCI Express (PCIe) 5.0, обеспечивает высокоскоростную передачу с малой задержкой между хост-процессором и такими устройствами, как серверные ускорители, буферы памяти и интеллектуальные устройства ввода-вывода», — заявляет Samsung.

Свой первый CXL-модуль памяти Samsung представила год назад. Чуть позже появилась и платформа для разработки. В конце прошлого года компания показала первую гибридную СХД Poseidon V2 с поддержкой CXL, которая позволяет объединить в одной платформе (Smart)SSD, DRAM и ускорители, а буквально на днях было продемонстрировано совместное с Liqid и Tanzanite решение для работы с пулами CXL-памяти.

Постоянный URL: http://servernews.ru/1065705
Система Orphus