Материалы по тегу: core

10.03.2023 [01:11], Владимир Мироненко

Великобритания хочет построить собственный суперкомпьютер на отечественных чипах за почти $1 млрд

На этой неделе премьер-министр Великобритании Риши Сунак (Rishi Sunak) представил программу, которая позволит стране «укрепить своё место в качестве мировой сверхдержавы в области науки и технологий к 2030 году». Одним из главных проектов программы должно стать создание HPC-системы, способной соперничать по мощности с самым производительным суперкомпьютером в мире Frontier (без учёта китайских OceanLight и Tianhe-3), установленным в США. По словам источников, министерство финансов пока не дало согласия на финансирование проекта.

Согласно данным источников ресурса Bloomberg, в настоящее время канцлер казначейства Великобритании обсуждает предложение Департамента науки, инноваций и технологий, созданного в феврале, вложить £800 млн ($946 млн) в создание суперкомпьютера. Frontier, к примеру, обошёлся США в $600 млн. Как утверждают в департаменте, суперкомпьютер обеспечит финансовый импульс отечественной технологической отрасли, поскольку, как предполагается, вычислительная система будет построена британскими фирмами с использованием чипов и систем, созданных британскими же производителями. То есть участие американской HPE и французской Atos, построивших многие из самых мощных суперкомпьютеров в мире, не предполагается.

 ARCHER2 — самый мощный суперкомпьютер Великобритании (Фото: EPCC/The University of Edinburgh)

ARCHER2 — самый мощный суперкомпьютер Великобритании (Фото: EPCC/The University of Edinburgh)

Ресурс The Register допустил, что ответственность за создание суперкомпьютера возложат на британский стартап Graphcore, который уже работает над ИИ-суперкомпьютером Good Machine. Стоит эта система около $120 млн, а производительность её составляет 10 Эфлопс в вычислениях пониженной точности (не FP64). The Register также допускает участие в проекте Arm, поскольку в Великобритании был запущен в работу первый в мире Arm-суперкомпьютер Isambarad, а японский Fugaku возглавлял TOP500. Ещё одним потенциальным участником проекта называется американская NVIDIA, которая также задействует Arm-ядра в новейших чипах Grace Superchip и Grace Hopper.

 Источник: Hyperion Research

Источник: Hyperion Research

Ситуация с мощными машинами усугубляется тем, что Великобритания в связи с Brexit'ом покинула консорциум EuroHPC, в создании которого принимала активное участие. Суперкомпьютеры EuroHPC уже занимают третье (финский LUMI от HPE) и четвёртое (итальянский Leonardo от Atos) место в последнем TOP500. В скором времени EuroHPC будут развёрнуты самый мощный европейский ИИ-суперкомпьютер MareNostrum-5, первый экзафлопсный суперкомпьютер JUPITER и шесть квантовых компьютеров. При этом Евросоюз активно вкладывается в создание собственных CPU и ускорителей, а также СХД.

Постоянный URL: http://www.servernews.ru/1083164
02.12.2022 [17:51], Сергей Карасёв

Graphcore представила ИИ-ускоритель C600 PCIe на чипе Colossus Mk2 GC200, предназначенный для Китая и Сингапура

Британская компания Graphcore анонсировала ускоритель C600 в виде карты расширения PCIe, предназначенный для задач ИИ и машинного обучения. Изделие поначалу будет доступно только на рынках Китая и Сингапура — о возможности организации поставок в другие регионы пока ничего не сообщается.

В основу новинки положен двухлетний чип IPU (Intelligence Processing Unit) Colossus Mk2 GC200. В основе IPU лежат не традиционные ядра, а так называемые «тайлы» — это области кристалла, содержащие как вычислительную логику, так и быструю память. В случае изделия Colossus Mk2 задействованы 892 Мбайт SRAM в 1472 тайлах, способных выполнять одновременно 8832 потока.

 Источник изображения: Graphcore

Источник изображения: Graphcore

Ускоритель Graphcore C600 имеет двухслотовое исполнение; используется интерфейс PCIe 4.0 x8. Показатель TDP равен 185 Вт. Заявленная производительность достигает 280 Тфлопс при FP16-вычислениях и 560 Тфлопс при вычислениях FP8. В одно серверное шасси могут устанавливаться до восьми ускорителей C600, связанных интерконнектом Graphcore IPU-Link, который обеспечивает пропускную способность до 256 Гбайт/с.

Компания Graphcore отмечает, что появление нового ускорителя является ответом на запросы клиентов, у которых конфигурации дата-центров, включая форматы стоек и подсистемы питания, могут сильно различаться. Релиз C600 состоялся на фоне ухудшения положения Graphcore. В сентябре стартап заявил, что планирует сокращение рабочих мест из-за крайне сложной макроэкономической ситуации. Вместе с тем инвесторы снизили оценку Graphcore на $1 млрд из-за финансовых проблем, включая расторжение сделки с Microsoft.

Нужно отметить, что в связи с вводом Соединёнными Штатами новых экспортных ограничений на поставки в Китай производители стали намеренно снижать быстродействие чипов. Так, производитель серверов Inspur начал применять вместо ускорителя NVIDIA A100 решение A800, разработанное NVIDIA специально для Китая в соответствии с санкциями. Пока не ясно, распространяется ли подобная практика на изделие Colossus Mk2.

Постоянный URL: http://www.servernews.ru/1078254
16.11.2022 [19:57], Сергей Карасёв

В Аргоннской национальной лаборатории появится ИИ-система Graphcore Bow IPU

Исследователи со всего мира в скором времени смогут получить доступ к новой вычислительной ИИ-системе компании Graphcore, которая будет установлена в Аргоннской национальной лаборатории Министерства энергетики США.

Речь идёт о комплексе Bow Pod Intelligence Processing Unit (IPU). Напомним, основной единицей IPU является не ядро, а «тайл» — область кристалла, содержащая как вычислительную логику, так и быструю память. В случае решения Bow применён кристалл второго поколения Colossus Mk2. Конфигурация включает 892 Мбайт SRAM в 1472 тайлах, способных выполнять одновременно 8832 потока. Подробнее об изделии можно узнать в нашем материале.

 Источник изображения: Аргоннская национальная лаборатория

Источник изображения: Аргоннская национальная лаборатория

В Аргоннской национальной лаборатории расположится система Bow Pod64 с производительностью 22 Пфлопс. Доступ к ней обеспечит площадка ALCF AI Testbed, на базе которой тестируются многие передовые технологии в области ИИ и глубокого обучения.

Ранее в лаборатории уже была смонтирована другая система Graphcore — IPU-M2000. Она тестировалась на научных приложениях машинного обучения, в частности, BraggNN (анализ данных рентгеновских экспериментов) и CANDLE Uno (исследования в области злокачественных образований). Специалисты пришли к выводу, что IPU «хорошо подходит для обычных задач машинного обучения и нерегулярных нагрузок».

Добавим, что в Аргоннской национальной лаборатории вскоре также заработает другая тестовая ИИ-система — комплекс DataScale нового поколения, который поставит молодая компания SambaNova Systems.

Постоянный URL: http://www.servernews.ru/1077461
14.11.2022 [16:16], Сергей Карасёв

OSS и TMGcore создали первый в мире мобильный суперкомпьютер с двухфазным иммерсионным охлаждением

Компании One Stop Systems (OSS) и TMGcore в ходе конференции SC22 продемонстрировали первый в мире суперкомпьютер с двухфазным иммерсионным (погружным) охлаждением. Новая версия системы OSS Rigel Edge Supercomputer предназначена для поддержания периферийных приложений и ИИ-нагрузок.

Технология иммерсионного охлаждения TMGcore предусматривает применение непроводящих, химически инертных, неагрессивных жидкостей. В них погружаются модули Rigel, что позволяет эффективно отводить тепло. А это даёт возможность создавать компактные системы с высокой производительностью.

«Являясь первым в мире суперкомпьютером с двухфазным иммерсионным охлаждением для мобильных ИИ-нагрузок, созданный комплекс обеспечивает новый уровень операционной эффективности, компактности, надёжности и производительности», — заявляют разработчики.

 Источник изображения: TMGcore

Источник изображения: TMGcore

Rigel используется в составе автономной системы охлаждения TMGcore EdgeBox 4.5. Утверждается, что по термоэффективности она в 400 раз превосходит традиционные воздушные системы. Кроме того, новое решение благодаря применению жидкости обеспечивает улучшенную защиту компонентов от физических воздействий. Компании уже работают над более компактной версией EdgeBox, которая сможет монтироваться на наземном, водном и воздушном транспорте.

 Источник изображения: OSS

Источник изображения: OSS

Узлы Rigel оборудованы 24-ядерными процессорами AMD EPYC, четырьмя ускорителями NVIDIA HGX A100, четырьмя 200G-адаптерами NVIDIA ConnectX-6 InfiniBand, NVMe-хранилищем вместимостью 64 Тбайт, а также восемью слотами для модулей оперативной памяти ECC DDR4 RDIMM/LRDIMM (до 128 Гбайт каждый) или RDIMM/LRDIMM-3DS (до 256 Гбайт каждый). Для питания используются сдвоенные БП мощностью 1600/2000 Вт. Диапазон рабочих температур — от 0 до 35 °C.

Постоянный URL: http://www.servernews.ru/1077300
28.04.2022 [15:56], Владимир Мироненко

Российский производитель СХД и серверов Yadro увеличил выручку в 2021 г. на 26 % и в 1,5 раза увеличил штат

Российский производитель электроники Yadro сообщил о результатах работы в 2021 г., который был успешным для компании. Её выручка увеличилась по сравнению с предыдущим годом на 26 %, т.е. до 33 млрд руб. (с НДС). По оценкам аналитической фирмы IDC, компания Yadro заняла на серверном рынке России второе место по выручке с долей почти в 17 % (21 % на рынке систем хранения данных).

Рост выручки стал возможен благодаря развитию продуктового портфеля. В конце 2020 г. компания запустила несколько новых продуктов, включая серверную платформу Vegman, представленную двумя моделями, и универсальную СХД корпоративного класса Tatlin.Unified. В течение года компания поставила рекордный объём продукции, в том числе более 4000 серверов семейства Vegman.

 Источник изображения: Yadro

Источник изображения: Yadro

В прошлом году Yadro запустила два крупных проекта с бюджетом более 12 млрд руб., профинансированных за счёт собственных средств. Первый — Yadro Fab Dubnа — строительство завода полного цикла по производству вычислительной техники и телекоммуникационного оборудования в Дубне (Московская обл.), второй — создание дизайн-центра полупроводниковой продукции Yadro Microprocessors для разработки и запуска линейки отечественных микропроцессоров на основе архитектуры RISC-V для различных типов вычислительной техники.

Сообщается, что в кратчайшие сроки была сформирована полноценная команда для создания SoC, определён целевой продуктовый портфель и реализованы начальные этапы разработки и подготовки к производству первых продуктов. В 2021 году Yadro открыла новый R&D центр в Нижнем Новгороде, усилив команды программной и аппаратной разработки в Москве, Санкт-Петербурге и Екатеринбурге. Персонал компании увеличился в общей сложности на 50 % до 1000 человек.

Наконец, отечественный разработчик процессорных IP-блоков и инструментов на базе открытой архитектуры RISC-V Syntacore, ныне входящий в группу Yadro, стал первой российской компанией, вошедшей в состав правления глобального консорциума RISC-V International. Глава и основатель Syntacore Александр Редькин был включён в совет директоров RISC-V International.

Постоянный URL: http://www.servernews.ru/1064876
25.04.2022 [22:55], Алексей Степин

Edgecore Networks представила 400G-коммутатор DCS240

Компания Edgecore Networks, специализирующаяся на разработке сетевых продуктов, использующих открытое ПО, представила новый высокопроизводительный 1U-коммутатор, предназначенный для гиперскейлеров и облачных провайдеров. Новая модель DCS240 относится к spine-коммутаторам и располагает 32-мя 400bE-портами QSFP56-DD. В основе платформы лежит чипсет Broadcom BCM56880 (Trident 4, до 12,8 Тбит/с).

 Изображение: Edgecore Networks

Изображение: Edgecore Networks

Коммутатор Edgecore DCS240 оснащён двумя блоками питания мощностью 1300 Вт каждый, а также шестью (5+1) — все с поддержкой горячей замены. Верхний ряд портов допускает использование мощных трансиверов 400G ZR/ZR+ (20 Вт), что позволяет расширить зону действия сети. По умолчанию на коммутатор загружено окружение ONIE для установки полноценной ОС, например, SONiC.

Предполагается, что новая модель может быть использована в связке с коммутаторами Edgecore DSC204 на базе чипсета Trident 3, которые предлагают 32 порта 100GbE (QSFP28). Такая связка получается экономичной и поддерживающей быстрое и удобное масштабирование инфраструктуры ЦОД, уже использующего 100G-сети без потерь в производительности.

Постоянный URL: http://www.servernews.ru/1064641
05.03.2022 [01:28], Алексей Степин

Graphcore анонсировала ИИ-ускорители BOW IPU с 3D-упаковкой кристаллов WoW

Разработка специализированных ускорителей для задач и алгоритмов машинного обучения в последние несколько лет чрезвычайно популярна. Ещё в 2020 году британская компания Graphcore объявила о создании нового класса ускорителей, которые она назвала IPU: Intelligence Processing Unit. Их архитектура оказалась очень любопытной.

Основной единицей IPU является не ядро, а «тайл» — область кристалла, содержащая как вычислительную логику, так и некоторое количество быстрой памяти с пропускной способностью в районе 45 Тбайт/с (7,8 Тбайт/с между тайлами). В первой итерации чип Graphcore получил 1216 таких тайлов c 300 Мбайт памяти, а сейчас компания анонсировала следующее поколение своих IPU.

 Изображения: Graphcore

Изображения: Graphcore

Новый чип, получивший название BOW, можно условно отнести к «поколению 2,5». Он использует кристалл второго поколения Colossus Mk2: 892 Мбайт SRAM в 1472 тайлах, способных выполнять одновременно 8832 потока. Этот кристалл по-прежнему производится с использованием 7-нм техпроцесса TSMC, но теперь Graphcore перешла на использование более продвинутой упаковки типа 3D Wafer-on-Wafer (3D WoW).

Новый IPU стал первым в индустрии чипом высокой сложности, использующем новый тип упаковки, причём технология 3D WoW была совместно разработана Graphcore и TSMC с целью оптимизации подсистем питания. Процессоры такой сложности отличаются крайней прожорливостью, а «накормить» их при этом не просто. В итоге обычная упаковка не позволяет добиться от чипа уровня Colossus Mk2 максимальной производительности — слишком велики потери и паразитный нагрев.

Реализована 3D WoW во многом аналогично технологии, применённой AMD в серверных чипах Milan-X. Упрощённо говоря, медные структуры-стержни пронизывают кристалл и позволяют соединить его напрямую с другим кристаллом, причём «склеиваются» они друг с другом благодаря. В случае с BOW роль нижнего кристалла отводится распределителю питания с системой стабилизирующих конденсаторов, который питает верхний кристалл Colossus Mk2. За счёт перехода с плоских структур на объёмные можно как увеличить подводимый ток, так и сделать путь его протекания более короткими.

В итоге компании удалось дополнительно поднять частоту и производительность BOW, не прибегая к переделке основного процессора или переводу его на более тонкий и дорогой техпроцесс. Если у оригинального IPU второго поколения максимальная производительность составляла 250 Тфлопс, то сейчас речь идёт уже о 350 Тфлопс — для системы BOW-2000 с четырьмя чипами заявлено 1,4 Пфлопс совокупной производительности. И это хороший выигрыш, полученный без критических затрат.

С внешним миром IPU общается по-прежнему посредством 10 каналов IPU-Link (320 Гбайт/с). Внутренней памяти в такой системе уже почти 4 Гбайт, причём работает она на скорости 260 Тбайт/с — критически важный параметр для некоторых задач машинного обучения, которые требуют всё большие по объёму наборов данных. Ёмкость набортной памяти далека от предлагаемой NVIDIA и AMD, но выигрыш в скорости даёт детищу Graphcore серьёзное преимущество.

Узлы BOW-2000 совместимы с узлами предыдущей версии. Четыре таких узла (BOW POD16) с управляющим сервером — всё в 5U-шасси — имеют производительность до 5,6 Пфлопс. А полная стойка с 16 узлами BOW-2000 (BOW POD64) даёт уже 22,4 Пфлопс. По словам компании, производительность новой версии возросла на 30–40 %, а прирост энергоэффективности составляет от 10 % до 16 %.

Graphcore говорит о десятикратном превосходстве BOW POD16 над NVIDIA DGX-A100 в полной стоимости владения (TCO). Cтоит BOW POD16 вдвое дешевле DGX-A100. К сожалению, говорить о завоевании рынка машинного обучения Graphcore рано: клиентов у компании уже довольно много, но среди них нет таких гигантов, как Google или Baidu. В долгосрочной перспективе ситуация для Graphcore далеко не безоблачна, но компания уже готовит третье поколение IPU на базе 3-нм техпроцесса.

Постоянный URL: http://www.servernews.ru/1061392
16.12.2021 [16:59], Сергей Карасёв

Российская компания Syntacore вошла в состав правления RISC-V International

RISC-V International сообщила о том, что российская компания Syntacore, подконтрольная российской же компании YADRO, получила статус премиального участника названной организации. При этом сооснователь и исполнительный директор Syntacore Александр Редькин вошёл состав правления RISC-V International.

Syntacore является отечественным разработчиком микропроцессорных ядер и специализированных инструментов на архитектуре RISC-V. Компания входит в число основателей открытого международного консорциума RISC-V. Его цель заключается в разработке и продвижение одноимённой открытой архитектуры.

 Изображение: Syntacore

Изображение: Syntacore

«Сегодняшний анонс ещё сильнее укрепляет наше лидирующее положение на рынке интеллектуальной собственности RISC-V в новом году и дальше. Вся наша интеллектуальная собственность полностью совместима с последней версией спецификации RISC-V», — отметил господин Редькин.

Компания Syntacore является одним из лидеров экосистемы RISC-V и лицензирует микропроцессорные технологии собственной разработки на базе данной архитектуры клиентам в России и за рубежом. Продукты на основе процессорных технологий компании разрабатываются по нормам от 180 до 7 нм.

Постоянный URL: http://www.servernews.ru/1056094
27.08.2020 [19:13], Алексей Степин

TSMC и Graphcore создают ИИ-платформу на базе технологии 3 нм

Несмотря на все проблемы в полупроводниковой индустрии, технологии продолжают развиваться. Технологические нормы 7 нм уже давно не являются чудом, вовсю осваиваются и более тонкие нормы, например, 5 нм. А ведущий контрактный производитель, TSMC, штурмует следующую вершину — 3-нм техпроцесс. Одним из первых продуктов на базе этой технологии станет ИИ-платформа Graphcore с четырьмя IPU нового поколения.

Британская компания Graphcore разрабатывает специфические ускорители уже не первый год. В прошлом году она представила процессор IPU (Intelligence Processing Unit), интересный тем, что состоит не из ядер, а из так называемых тайлов, каждый из которых содержит вычислительное ядро и некоторое количество интегрированной памяти. В совокупности 1216 таких тайлов дают 300 Мбайт сверхбыстрой памяти с ПСП до 45 Тбайт/с, а между собой процессоры IPU общаются посредством IPU-Link на скорости 320 Гбайт/с.

 Colossально: ИИ-сервер Graphcore с четырьмя IPU на борту

Colossально: ИИ-сервер Graphcore с четырьмя IPU на борту

Компания позаботилась о программном сопровождении своего детища, снабдив его стеком Poplar, в котором предусмотрена интеграция с TensorFlow и Open Neural Network Exchange. Разработкой Graphcore заинтересовалась Microsoft, применившая IPU в сервисах Azure, причём совместное тестирование показало самые положительные результаты. Следующее поколение IPU, Colossus MK2, представленное летом этого года, оказалось сложнее NVIDIA A100 и получило уже 900 Мбайт сверхбыстрой памяти.

Машинное обучение, в основе которого лежит тренировка и использование нейронных сетей, само по себе требует процессоров с весьма высокой степенью параллелизма, а она, в свою очередь, автоматически означает огромное количество транзисторов — 59,4 млрд в случае Colossus MK2. Поэтому освоение новых, более тонких и экономичных техпроцессов является для этого класса микрочипов ключевой задачей, и Graphcore это понимает, заявляя о своём сотрудничестве с TSMC.

 Тайловая архитектура Graphcore

Тайловая архитектура Graphcore Colossus MK2

В настоящее время TSMC готовит к началу «рискового» производства новый техпроцесс с нормами 3 нм, причём скорость внедрения такова, что первые продукты на его основе должны увидеть свет уже в 2021 году, а массовое производство будет развёрнуто во второй половине 2022 года. И одним из первых продуктов на базе 3-нм технологических норм станет новый вариант IPU за авторством Graphcore, известный сейчас как N3. Судя по всему, использовать 5 нм британский разработчик не собирается.

 В планах компании явно указано использование 3-нм техпроцесса

В планах компании явно указано использование 3-нм техпроцесса

В настоящее время чипы Colossus MK2 производятся с использованием техпроцесса 7 нм (TSMC N7). Они включают в себя 1472 тайла и способны одновременно выполнять 8832 потока. В режиме тренировки нейросетей с использованием вычислений FP16 это даёт 250 Тфлопс, но существует удобное решение мощностью 1 Пфлопс — это специальный 1U-сервер Graphcore, в нём четыре IPU дополнены 450 Гбайт внешней памяти. Доступны также платы расширения PCI Express c чипами IPU на борту.

Дела у Graphcore идут неплохо, её технология оказалась востребованной и среди инвесторов числятся Microsoft, BMW, DeepMind и ряд других компаний, разрабатывающих и внедряющих комплексы машинного обучения. Разработка 3-нм чипа ещё более упрочнит позиции этого разработчика. Более тонкие техпроцессы существенно увеличивают стоимость разработки, но финансовые резервы у Graphcore пока есть; при этом не и исключён вариант более тесного сотрудничества, при котором часть стоимости разработки возьмёт на себя TSMC.

Постоянный URL: http://www.servernews.ru/1019252
Система Orphus