Материалы по тегу: cpu

11.05.2022 [21:40], Игорь Осколков

Tachyum анонсировала универсальные процессоры Prodigy: 128 ядер с частотой 5,7 ГГц, которые втрое быстрее AMD EPYC 7763 и NVIDIA H100

Словацкая компания Tachyum официально представила серверные процессоры Prodigy, над которыми она трудилась несколько лет. По словам создателей, это первые в мире по-настоящему универсальные чипы, которые способны одновременно заменить CPU, GPU и TPU. Более того, Tachyum заявляет, что её процессоры не только быстрее всех остальных, но и дешевле и энергоэффективнее.

Универсальность Prodigy заключается в том числе в возможности запускать бинарные файлы, собранные для архитектур x86-64, Arm и RISC-V в дополнение к нативным для данной 64-бит ISA приложениям. Tachyum говорит, что её чипы подойдут для задач ИИ и HPC, а также будут привлекательными для гиперскейлеров. Тестовые образцы компания начнёт рассылать уже в этом году, а старт массового производства намечен на первую половину 2023-го. Кроме того, компания предлагает IP-блоки TPU для инференс-систем IoT/Edge.

 Изображения: Tachyum

Изображения: Tachyum

Старшая в семействе новых 5-нм CPU, которое включает восемь устройств, модель имеет 128 унифицированных ядер, работающих на частоте 5,7 ГГц. По предварительным данным, у каждого ядра есть по 64 Кбайт L1-кеша для данных и инструкций, а также 128 Мбайт L2+L3. В деталях об архитектуре и микроархитектуре новинок пока не рассказывается, но упоминается внеочередное исполнение и возможность выполнения до четырёх инструкций за такт, а также поддержка виртуализации и расширенных RAS-функций. У каждого ядра есть два 1024-бит векторных блока и один 4096-бит матричный блок.

 FPGA-эмулятор Tachyum Prodigy

FPGA-эмулятор Tachyum Prodigy

Процессор снабжён 16-ю контроллерами памяти с поддержкой модулей DDR5-7200 суммарным объёмом до 8 Тбайт. При этом есть возможность создавать двух- и четырёхпроцессорные системы. Связь с внешним миром обеспечивают 32 контроллера PCIe, которые суммарно дают 64 линии PCIe 5.0. TDP для данной модели не указывается, но компания говорит о возможности использования воздушного и жидкостного охлаждения.

Базовые характеристики впечатляют, но ещё более удивительными выглядят заявления разработчиков о производительности будущего флагмана. В SPECrate 2017 Int он примерно вчетверо быстрее Xeon Platinum 8380 и втрое быстрее EPYC 7763, старших моделей процессоров Intel и AMD текущего поколения. Более того, компания обещает, что FP64-производительность новинок будет втрое больше, чем у грядущих ускорителей NVIDIA H100, то есть составит порядка 180 Тфлопс.

А в FP8-вычислениях производительность будет выше, чем у H100, сразу в шесть раз — 24 Пфлопс! При этом новинки, со слов Tachyum, будут энергоэффективнее всех этих чипов. Для Prodigy заявлена поддержка форматов FP64, FP32, TF32, BF16, INT8, FP8 и некоего TAI, а также работа с т.н. разреженными (sparsed) вычислениями, которые важны для ИИ-нагрузок. Правда, пока что анонс можно назвать «бумажным», поскольку детальные характеристики чипов компания не предоставила, ограничившись лишь рассказами о том, как они хороши.

Тем не менее, о прогрессе разработки Tachyum докладывает регулярно. На текущий момент компания предлагает разработчикам аппаратный эмулятор на базе FPGA — всего 8 ядер Prodigy, но с возможностью масштабирования до 64 ядер. Этот эмулятор компания сама использует для отладки ПО. Она уже адаптировала ядро Linux и базовое окружение, UEFI, KVM/QEMU, GCC, а также успешно сделала порт FreeBSD для своей архитектуры.

Постоянный URL: http://servernews.ru/1065734
11.05.2022 [19:05], Алексей Степин

Фото дня: чипы Intel Xeon Sapphire Rapids с HBM-памятью

Корпорация Intel продолжает активно готовить к выпуску новую серверную платформу Sapphire Rapids, и на мероприятии Intel Vision новые процессоры демонстрируются во всех видах, включая корпуса со снятой теплораспределительной крышкой и даже кремниевые пластины с кристаллами. Ресурс ServeTheHome сделал несколько фото новинок.

В четвёртом поколении Xeon Scalable компания Intel, всегда отдававшая предпочтение монолитным дизайнам своих процессоров, наконец, перешла на чиплетную компоновку. Sapphire Rapids получит четыре таких чиплета, соединённых посредством интерфейса EMIB и фабрики Multi-Die Fabric IO.

Изображение: ServeTheHome

Компания показала прототипы Sapphire Rapids, оснащённые сборками памяти HBM2e. Этот вариант отличается иным корпусом с характерными выступами. Такие процессоры составят основу суперкомпьютера Aurora. Назначение маленького кристалла, расположенного на правом текстолитовом выступе не уточняется. Он присутствует и в обычной версии Sapphire Rapids, но расположен иначе. Более подробно ознакомиться с новинками можно на ServeTheHome, где представлены фото обычной и HBM-версии новинок.

Постоянный URL: http://servernews.ru/1065718
11.05.2022 [03:16], Андрей Галадей

В LLVM добавили поддержку будущих серверных Arm-процессоров Ampere

В апстрим LLVM Clang 15 добавлена поддержка грядущих серверных Arm-процессоров, которые разрабатывает компания Ampere Computing. Релиз очередной мажорной версии LLVM намечен на осень этого года, да и выход новых CPU тоже должен состояться в этом году.

Как отмечает Phoronix, новая архитектура пока обозначена как Ampere1 и соответствует Armv8.6-A с поддержкой FP16, MTE (Memory Tagging), Speculation Barrier (SB), (Speculative Store Bypass Safe (SSBS) и других особенностей. Аналогичные патчи были отправлены в GCC ещё в ноябре прошлого года, так что Ampere можно похвалить за своевременную подготовку средств разработки и отладки ПО для новых процессоров.

Отметим, что относительно указанного наименования Ampere1 (или Ampere-1 в случае GCC) нигде не уточняется, является ли это обозначение рабочим наименованием чипов (как прежде бывало со многими другими платформами), новым брендом или торговой маркой или чем-либо ещё. Будущие процессоры Ampere будут использоваться 5-нм ядра, известные сейчас под кодовым именем Syrin. Они должны получить не менее 128 ядер, поддержку DDR5 и PCIe 5.0.

Постоянный URL: http://servernews.ru/1065571
04.05.2022 [21:29], Алексей Степин

AMD предложила внедрить в процессоры EPYC ИИ-ускорители на базе FPGA Xilinx

Модульный подход к компоновке процессоров имеет как недостатки, так и преимущества. К первым относится ограниченность межъядерной коммуникации, а ко вторым — возможность легко регулировать количество чиплетов в процессорах, предназначенных для разных сегментов рынка. AMD пошла ещё дальше — теперь чиплеты получили уникальную возможность установки дополнительного кеша сверху основного кристалла (3D V-Cache в Milan-X), а вскоре появятся и чиплеты, включающие не только ядра CPU.

В попытках сделать как можно более универсальный процессор тоже видны два подхода. Intel уповает на инструкции AVX-512, которые получили расширения VNNI для работы с актуальными ИИ-нагрузками. А вскоре к ним добавится ещё и набор AMX. Базовый набор инструкций у AMD не менялся уже достаточно давно, но будущие EPYC вскоре тоже получат возможность работы с ИИ-задачам, как раз благодаря модульной компоновке. Новые патенты AMD говорят о сочетании CPU- и FPGA-чиплетов поглощённой ранее Xilinx в одной SoC.

 Изображения: AMD (via Tom's Hardware)

Изображения: AMD (via Tom's Hardware)

Патенты покрывают два способа интеграции новых кристаллов : либо добавлением нового чиплета по соседству с другими, либо использование 3D-стекинга как в случае с 3D V-Cache. В последнем случае возникают некоторые трудности с теплоотводом при размещении ускорителей непосредственно над CPU-чиплетами, поэтому AMD предлагает устанавливать новые чипы на IO-модуль.

Новые процессоры AMD EPYC, имеющие гетерогенную чиплетную архитектуру должны увидеть свет уже в 2023 году в поколении Zen 4 в виде 5-нм платформ Genoa (до 96 ядер) и Bergamo (128 ядер). И это только начало, ведь ничто не мешает использовать и другие виды чиплетов, от GPU и DPU до специфических DSP и даже ASIC. Впрочем, скорее всего, подобные чипы будут востребованы относительно небольшим числом клиентов или вообще будут создавать на заказ, как это ранее уже произошло с Intel.

Первые гибридные процессоры Xeon с FPGA компании Altera, которую Intel в итоге купила годом позже, были анонсированы ещё в 2014 году. По неофициальным данным, эти чипы создавались для обслуживания и ускорения работы СУБД Oracle. Следующая попытка была предпринята уже в поколении Skylake-SP. Тогда появился чип Intel Xeon Gold 6138P с ПЛИС Arria 10 GX 1150, соединённой с ядрами процессора посредством UPI. Одна из сфер его применение — телекоммуникации.

Постоянный URL: http://servernews.ru/1065294
27.04.2022 [22:48], Алексей Степин

Arm анонсировала высокопроизводительные, но экономичные ядра Cortex-M85 для современных IoT-решений

В семейство Arm Cortex-M входят относительно недорогие решения, ориентированные на минимальное энергопотребление. SoC на основе таких ядер обычно лежат в основе различных встраиваемых систем и устройств класса IoT. Впрочем, наработки из мира «больших» Cortex-A проникают и в этот сегмент: ещё в феврале 2020 года компания анонсировала серию Cortex-M55 (ARMv8.1-M), но сейчас она уступает место новому лидеру — Cortex-M85.

Для своего класса это действительно во многом уникальное процессорное ядро. В области целочисленных вычислений оно опережает Cortex-M7 с его шестистадийным суперскалярным конвейером, а при работе с векторными расширениями Helium, дебютировавшими в Cortex-M55, оказывается быстрее последнего. Новинка предназначена для устройств, которым необходим достаточно высокий уровень производительности, но при этом и такие возможности, как детерминированность поведения и низкая латентность при обработке прерываний.

 Изображения: Arm

Изображения: Arm

Новое ядро построено на основе того же набора инструкций, ARMv8.1-M, но имеет конвейер с семью стадиями для целочисленного блока, опциональныe FPU с поддержкой FP16/32/64 и векторные расширения Helium (M-profile). Дополнительный 64-бит интерфейс позволяет ядру работать совместно с кастомными ускорителями (до 8 шт.) и инструкциями. Имеются 32-бит расширения DSP/SIMD. Объёмы кешей данных и инструкций первого уровня составляют до 64 Кбайт каждый, а объём кешей более высоких уровней может достигать аж 16 Мбайт.

Опционально поддерживается модуль защиты памяти MPU — до 16 изолированных регионов с различным уровнем безопасности при наличии TrustZone. Интегрированный контроллер прерываний NVIC (Nested Vectored Interrupt Controller) поддерживает обработку до 480 прерываний, а также NMI. Отдельно реализован контроллер пробуждения для быстрого выхода процессора из спящих режимов.

В Cortex-M85 реализованы развитые средства отладки, включая блок мониторинга производительности и опциональные блоки трассировки. За безопасность отвечает Arm TrustZone и расширения (Pointer Authentication, Branch Target Identification), так что новое ядро отвечает требованиям PSA Certified Level 2. С внешним миром ядро общается посредством трёх шин — основной 64-битной AMBA 5 AXI, совместимой с версией AXI4 и двух шин AMBA 5 AHB, одна из которых используется для периферии.

На данный момент это самое быстрое Arm-ядро в семействе M — его производительность оценивается в 6,28 CoreMark/МГц и 8,76DMIPS/МГц. Оно доступно в составе эталонных платформ Corstone-310 и Ethos-U55. Решения на базе новинок можно разрабатывать уже сейчас с помощью Arm Virtual Hardware, поскольку готовые чипы с новыми ядрами, вероятно, появятся не раньше, чем через год. Более подробно о новинке можно узнать из анонса и в разделе сайта Arm для разработчиков.

Постоянный URL: http://servernews.ru/1064828
12.04.2022 [18:14], Владимир Мироненко

Производитель серверных Arm-процессоров Ampere Computing готовится к IPO

Разработчик серверных Arm-процессоров Ampere Computing, основанный одним из бывших президентов Intel, сообщил о подаче конфиденциальной заявки на первичное публичное размещение акций (IPO) в США. Ранее многие аналитики ожидали, что компания будет продана какому-то крупному игроку из числа гиперскейлеров, на рынок которых и рассчитана её продукция.

Базирующаяся в Санта-Кларе (Калифорния) компания была основана в 2018 году. Ampere Computing входит в число разработчиков чипов, готовых бросить вызов технологическим гигантам AMD, Intel и NVIDIA, доминирующим на стремительно развивающемся рынке чипов для центров обработки данных и облачных вычислений, спрос на которые резко вырос во время пандемии и перехода многих компаний на удалённую работу.

Как отмечает агентство Reuters, рынок IPO в Соединённых Штатах замедлился в связи с насыщением спроса со стороны инвесторов и высокой волатильности из-за неблагоприятных макроэкономических условий, заставивших компании отложить проведение IPO или выход на биржу посредством SPAC. В конце прошлого года Softbank, нынешний владелец тоже готовящейся к IPO компании Arm, оценил рыночную стоимость Ampere Computing в $8 млрд.

Являясь частной компанией, Ampere Computing провела немногим более года назад крупный раунд финансирования, в ходе которого привлекла $300 млн, причём единственным участником этого раунда была Oracle. А всего в Ampere, согласно данным Комиссии по ценным бумагам и биржам США (SEC), Oracle вложила более $400 млн. Причём инвестировать она начала практически одновременно с отказом от развития процессоров SPARC, которые достались ей в наследство от Sun.

Другими инвесторами компании являются Arm и частная инвестиционная фирма The Carlyle Group. Напомним, основатель и гендиректор Ampere Рене Джеймс (Renee James) входит в советы директоров Citigroup и Oracle. Благодаря IPO разработчик чипов получит больше средств для расширения своей базы облачных клиентов и, возможно, даже для выхода на рынок корпоративных серверов. Первым массово внедрять новые процессоры ожидаемо стало облако самой Oracle.

После использования готовых ядер Neoverse N1 от Arm для своих чипов Altra и Altra Max, выпущенных в 2020 и 2021 годах соответственно, Ampere решила разработать собственные ядра для следующих поколений процессоров. В этом году должен выйти её 5-нм чип Siryn, а следующее поколение процессоров должно появиться в 2023 году. Однако для этого нужна архитектурная лицензия от Arm, которая намного дороже лицензий на готовые ядра.

Кроме того, Ampere Computing, вероятно, придётся нанять гораздо больше инженеров для создания высокопроизводительных и энергоэффективных CPU, способных конкурировать с AMD EPYC Bergamo, Intel Xeon Sierra Forest и разработками самой Arm. На это тоже необходимы средства, которые Ampere рассчитывает получить в ходе IPO. При этом сильных конкурентов, ориентированных на рынок гиперскейлеров, у компании нет — Nuvia была выкуплена Qualcomm, которая пока не очень интересуется серверным рынком, а Marvell окончательно забросила ThunderX.

Постоянный URL: http://servernews.ru/1063828
29.03.2022 [16:12], Сергей Карасёв

Востребованность серверных Arm-процессоров растёт

Компания TrendForce обнародовала прогноз по мировому рынку серверных процессоров на архитектуре Arm. Аналитики полагают, что востребованность таких изделий в обозримом будущем продолжит расти, а основными драйверами отрасли станут облачные платформы и центры обработки данных. Ранее Omdia уже отмечала рекордный рост поставок серверов с Arm-процессорами.

В настоящее время, как отмечается, наблюдается активное развитие платформ высокопроизводительных вычислений и систем ИИ. Это способствует росту спроса на чипы Arm, которые обеспечивают сокращение потребления энергии по сравнению с решениями x86. Согласно прогнозам, к 2025 году проникновение процессоров с архитектурой Arm в сегменте серверов для центров обработки данных достигнет 22 %. Но пока архитектура x86 доминирует на рынке, и до 2025 года Arm будет сложно конкурировать с ней.

 Источник изображения: Arm

Источник изображения: Arm

TrendForce выделяет три основных преимущества чипов Arm. Во-первых, такие изделия могут поддерживать разнообразные и быстро меняющиеся рабочие нагрузки. Arm-процессоры обеспечивают хорошую масштабируемость и экономичность. Во-вторых, решения на архитектуре Arm предоставляют более широкие возможности в плане оптимизации для различных нишевых рынков. Наконец, в-третьих, такие изделия позволяют экономить площадь для размещения оборудования.

Говорится, что с точки зрения поставщиков облачных услуг, которые в настоящее время внедряют процессоры на базе Arm, чипы Amazon Graviton имеют самый большой рыночный потенциал. Платформа Amazon Web Services (AWS) в 2021 году довела долю Arm-процессоров до 15 %, а в 2022-м это значение достигнет 20 %. Кроме того, другие крупные поставщики облачных услуг инициируют собственные проекты, предполагающие применение чипов Arm.

Под влиянием геополитики и укрепления суверенитета данных в разных странах крупные поставщики облачных услуг и операторы связи активно развивают малые ЦОД, которые будут способствовать дальнейшему проникновению процессоров на базе Arm. Чипы Arm и далее будут востребованы гиперскейлерами и поставщиками инфраструктуры периферийных вычислений.

Постоянный URL: http://servernews.ru/1062974
28.03.2022 [13:23], Сергей Карасёв

Серверные процессоры AMD EPYC Genoa получат до 96 Мбайт кеша L2 — по 1 Мбайт на ядро

В популярном бенчмарке Geekbench появилась информация об одном из процессоров AMD EPYC поколения Genoa: эти чипы будут использоваться в серверах и системах высокопроизводительных вычислений. Официальная презентация изделий ожидается во второй половине текущего года.

В основу процессоров ляжет микроархитектура Zen 4. Чипы будут изготавливаться на предприятии TSMC с применением 5-нм технологии. Заявлена в 1,25 раза более высокая производительность по сравнению с 7-нм решениями.

 Источник изображения: VideoCardz

Источник изображения: VideoCardz

В тесте Geekbench отметился процессор Genoa с кодовым обозначением 100-000000479-13. Он содержит 32 вычислительных ядра с возможностью одновременной обработки до 64 потоков инструкций. Базовая тактовая частота составляет 1,2 ГГц, максимальная частота — 3,4 ГГц.

 Источник изображения: Geekbench

Источник изображения: Geekbench

Бенчмарк говорит о том, что процессоры Genoa получат 1 Мбайт кеш-памяти второго уровня (L2) в расчёте на каждое ядро. Размер кеша первого уровня (L1) составляет по 32 Кбайт для инструкций и данных, объём кеша третьего уровня (L3) — 4 Мбайт на каждое ядро.

 Источник изображения: VideoCardz

Источник изображения: VideoCardz

В семейство Genoa войдут изделия, насчитывающие до 96 вычислительных ядер. Чипы будут поддерживать оперативную память DDR5-5200.

 Источник изображения: AMD

Источник изображения: AMD

Постоянный URL: http://servernews.ru/1062890
22.03.2022 [18:48], Игорь Осколков

NVIDIA анонсировала 144-ядерные Arm-процессоры Grace и гибрид Grace Hopper

Главным событием GTC 2022 стал анонс новых ускорителей H100 (Hopper), которые станут доступны в III квартале 2022 года. Вслед за ними в первой половине 2023 года появятся давно обещанные CPU Grace и гибридная система Grace Hopper, сочетающие, как понятно из названия, процессоры Grace (ARMv9) и ускорители Hopper.

Как и было сказано ранее, для связи всех компонентов между собой будет использоваться mesh-сеть на базе всё той же шины NVLink 4.0 (900 Гбайт/с) с кеш-когерентностью. А сочетание LPDDR5X (с ECC, конечно) и HBM даст суммарный объём памяти до 600 Гбайт с общей полосой пропускания порядка 2 Тбайт/с. Для Grace Hopper компания подготовит полный стек ПО, благо портированием на Arm она начала заниматься ещё 3 года назад.

 NVIDIA Grace (Изображения: NVIDIA)

NVIDIA Grace (Изображения: NVIDIA)

Двухчиповый процессор Grace Superchip для ИИ- и HPC-нагрузок имеет 144 ядра, результат которых в SPECrate2017_int_base составляет 740, что, по словам компании, в полтора раза выше, чему у пары AMD EPYC, использующихся в DGX A100. И это, честно говоря, не такой уж и впечатляющий результат.

Но NVIDIA утверждает, что новые CPU вдвое лучше по отношению производительности к энергопотреблению, чем «традиционные серверы» — использование LPDDR5X позволяет добиться пропускной способности памяти в 1 Тбайт/с, а вся сборка CPU+RAM будет потреблять менее 500 Вт.

Чипы (или чиплеты, если хотите) в Grace Superchip тоже объединены посредством NVLink, только в данном случае этот интерконнект называется NVLink-C2C (Chip-to-Chip). И его NVIDIA предлагает использовать другим компаниям для создания кастомных сборок, объединяющих необходимые кристаллы, да и сама готова масштабировать и адаптировать свои решения под нужды заказчика.

По словам NVIDIA, NVLink-C2C в 25 раз энергоэффективнее PCIe 5.0, а для его реализации нужна в 90 раз меньшая площадь кремния. Шина предлагает высокую скорость (да-да, всё те же 900 Гбайт/с), низкий уровень задержек, поддержку атомарных операций и совместимость с Arm AMBA CHI, CXL и UCIe.

Постоянный URL: http://servernews.ru/1062436
21.03.2022 [16:16], Сергей Карасёв

AMD выпустила процессоры Milan-X: 64 ядра Zen3 и 768 Мбайт L3-кеша за $8800

Компания AMD подготовила к выпуску серверные процессоры EPYC 7003 семейства Milan-X, которое включает модели с 16, 24, 32 и 64 вычислительными ядрами. Максимальный объём кеш-памяти L3 составляет 768 Мбайт. Показатель TDP — до 280 Вт. Чипы совместимы с существующими SP3-платформами, для которых понадобится только обновление встроенного ПО.

 Источник: Anandtech

Источник: Anandtech

Milan-X — это первые серверные процессоры AMD, поддерживающие фирменную технологию 3D V-Cache. Реализована трёхмерная упаковка микрочипов с использованием гибридных соединений «медь-медь» и сквозных кремниевых соединений (TSV). Дополнительные SRAM-блоки ёмкостью 64 Мбайт изготавливаются по тому же техпроцессу TSMC N7 и монтируются поверх кеш-модулей (32 Мбайт) в чиплетах «обычных» EPYC 7003.

 Изображение: AMD (via Anandtech)

Изображение: AMD (via Anandtech)

Младший из представителей семейства имеет обозначение 7373X. Чип содержит 16 ядер с номинальной тактовой частотой 3,05 ГГц и максимальной частотой в турбо-режиме 3,8 ГГц. Цена решения — $4185. Ещё один процессор получил шифр 7473X. Он объединяет 24 вычислительных ядра. Базовая тактовая частота составляет 2,8 ГГц, максимальная частота — 3,7 ГГц. Стоит изделие $3900. Младшие чипы имеют базовый TDP 240 Вт.

 Изображение: AMD

Изображение: AMD

Ступенью выше располагается чип 7573X с 32 ядрами. Его частота может повышаться с 2,8 ГГц до 3,6 ГГц. Цена — $5590. Возглавляет семейство процессор 7773X с 64 вычислительными ядрами. Базовая тактовая частота равна 2,2 ГГц, частота в турбо-режиме — 3,5 ГГц. Это решение оценено в $8800. У обоих старших чипов показатель TDP составляет 280 Вт.

Постоянный URL: http://servernews.ru/1062380
Система Orphus