Материалы по тегу: hardware
29.11.2023 [15:59], Руслан Авдеев
Дата-центры Google в Неваде запитали от уникальной геотермальной электростанции Fervo EnergyGoogle пожинает первые плоды уникального геотермального проекта, реализуемого совместно с компанией Fervo Energy в Неваде. Как сообщается в блоге Google, техногигант стал на шаг ближе к декарбонизации своего бизнеса. К 2030 году Google планирует добиться нулевого углеродного выброса при энергоснабжении ЦОД и офисных кампусов компании. Два года назад Google заключила со стартапом Fervo соглашение о совместной разработке проекта геотермальной электрочстанции, предусматривавшего поставку 5 МВт. ИИ-решения Google должна были оптимизировать работу станции. Заработавшая электростанция поставляет около 3,5 МВт в местные энергосети, в том числе обслуживающие и ЦОД компании. Google и Fervo подписывают соглашения о покупке энергии (PPA) — полученное электричество не обязательно поступает именно в ЦОД Google, но это помогает изменить общий баланс энергии в сетях в пользу безуглеродных источников. ![]() Источник изображения: Google Как заявляют в Министерстве энергетики США, к 2050 году геотермальные источники смогут выдавать до 120 ГВт или 16 % от общих потребностей страны в электричестве. При этом во многих регионах это оптимальное решение для получения «чистой» энергии, поскольку доступ к другим возобновляемым источникам ограничен — такое, например, характерно для Азиатско-Тихоокеанского региона. При этом геотермальную энергию используют относительно редко, а коммерческое применение соответствующим технологиям можно найти только в местностях где до подземного тепла весьма легко добраться. В отличие от обычных геотермальных электростанций, Fervo применяет технологии горизонтального бурения скважин, ранее характерные только для нефтегазовой промышленности. Это позволяет добраться до источников тепла, прежде недоступных. Fervo пробурила две скважины и разместила оптоволоконные кабели, позволяющие получать данные о температуре и других характеристиках системы в режиме реального времени. Благодаря новым технологиям геотермальная электростанция занимает меньше места, чем другие проекты такого типа. Также Google анонсировала сотрудничество с некоммерческой организацией Project InnerSpace, которая намерена ускорить внедрение электростанций такого типа. Участвуют в таких природоохранных инициативах и другие техногиганты. Например, Microsoft ещё в мае заключила соглашение о закупке 51 МВт геотермальной энергии в Новой Зеландии. Есть и примеры прямого использования энергии из таких источников дата-центрами. В Кении начато строительство ЦОД Ecocloud Data Centre на геотермальном поле, электричество будет получать как сам объект, так и другие предприятия.
29.11.2023 [15:15], Сергей Карасёв
Объём мирового рынка микросерверов вырастет в четыре раза к 2032 году, превысив $120 млрдКомпания Allied Market Research опубликовала прогноз по глобальному рынку микросерверов до 2032 года. Аналитики полагают, что данный сегмент ждёт устойчивое развитие, что объясняется растущей потребностью в распределённых вычислениях, увеличением спроса на edge-решения и расширением Интернета вещей (IoT). Отмечается, что по итогам 2022 года глобальные затраты на микросерверы составили $28,8 млрд. В дальнейшем ожидается значение CAGR (среднегодовой темп роста в сложных процентах) на уровне 15,8 %. Если этот прогноз оправдается, к 2032-му расходы поднимутся до $122,4 млрд, то есть, вырастут более чем в четыре раза по отношению к 2022-му. В прошлом году, по оценкам, аппаратные компоненты обеспечили почти три пятых в общем объёме выручки на мировом рынке микросерверов. Вместе с тем до 2032 года наибольшие темпы роста будут наблюдаться в сегменте ПО с величиной CAGR около 17,8 %. Это связано с переходом к контейнеризации и проектированию микросервисов. ![]() Источник изображения: HPE В плане аппаратных платформ на традиционные решения, к которым относятся изделия Intel, в 2022 году пришлось более половины выручки на рынке микросерверов. В дальнейшем ожидается быстрый рост спроса на альтернативные системы (в том числе с архитектурой Arm) с показателем CAGR на уровне 19,5 % до 2032 года. Крупные предприятия являются основными покупателями микросерверов: в 2022-м они обеспечили более двух третей от общей выручки. Вместе с тем, согласно прогнозам, в сегменте малых предприятий и среднего бизнеса будет наблюдаться самый высокий показатель CAGR — 17,7 % до 2032 года. Связано это с внедрением микросерверов в таких отраслях, как розничная торговля и гостиничный бизнес. Сегмент облачных вычислений в 2022 году обеспечил более двух пятых выручки на рассматриваемом рынке. Самым крупным регионом сбыта является Северная Америка. Ожидается, что в Азиатско-Тихоокеанском регионе до 2032-го будет наблюдаться самое высокое значение CAGR — 19,3 %.
29.11.2023 [13:09], Сергей Карасёв
Поставки процессоров AMD и Intel в Россию резко сократилисьВ январе–октябре 2023 года поставки процессоров AMD и Intel на российский рынок, по сообщению газеты «Коммерсантъ», рухнули более чем в два раза (с учётом параллельного импорта). Отчасти это связано с тем, что в сложившейся геополитической обстановке чипы отгружаются в РФ в составе готовых систем — серверов, СХД и пр. По итогам десяти месяцев 2023-го, согласно данным IT-холдинга Fplus, в Россию поступили около 35 тыс. процессоров AMD, что на 70 % меньше по сравнению с показателем за аналогичный период прошлого года. При этом в денежном выражении поставки упали на 98 % — до 372 млн руб. Отгрузки изделий Intel на российский рынок в январе–октябре 2023 года составили 178 тыс. шт/ на 3,2 млрд руб. Падение по сравнению с прошлогодними значениями зафиксировано на отметке 64 % и 62 % соответственно. При этом Fplus подчёркивает, что «небольшая часть процессоров ввозится в страну под другим кодом, поэтому в поставках не отображается». ![]() Источник изображения: AMD Участники рынка связывают тенденцию с несколькими факторами, передаёт «Коммерсантъ». Крупные российские производители IT-оборудования, такие как Yadro, «Аквариус» и Fplus, на фоне санкций закупили большое количество компонентов, излишки которых теперь продают другим компаниям. На сокращение поставок также повлияли инфляция и увеличение ставок по кредитам. Кроме того, в апреле из реестра Минпромторга были исключены несколько десятков компаний, которые выпускали оборудование на зарубежных CPU. Вместе с тем некоторые корпоративные пользователи искусственно продлевают жизненный цикл оборудования.
29.11.2023 [13:02], Сергей Карасёв
Для VMware Cloud on AWS стали доступны инстансы M7i bare metalКомпания VMware объявила о том, что для платформы VMware Cloud on AWS реализована поддержка инстансов Amazon EC2 M7i bare-metal (m7i.metal-24xl) на базе кастомных Intel Xeon Sapphire Rapids. Конфигурация включает 96 vCPU и около 414 Гбайт памяти. Решение, как отмечается, поможет клиентам ускорить миграцию в облако и модернизацию корпоративных приложений. VMware Cloud on AWS позволяет работать с ПО VMware для программно-определяемых центров обработки данных (SDDC) корпоративного класса в облаке AWS, используя оптимизированный доступ к собственным сервисам AWS. Платформа создана на основе VMware Cloud Foundation. Сервис совмещает решения для вычислений, хранения данных и виртуализации сети (VMware vSphere, VMware vSAN и VMware NSX), а также инструменты управления VMware vCenter Server, оптимизированные для работы в выделенной эластичной инфраструктуре AWS. VMware Cloud on AWS предоставляет однопользовательскую среду с поддержкой от 4 до 16 хостов на каждый кластер vSphere. Объединив M7i bare metal с томами Amazon FSx для NetApp ONTAP и VMware Cloud Flex Storage, клиенты могут расширять хранилище по мере необходимости независимо от вычислительных мощностей, чтобы максимизировать использование ресурсов. Для рабочих нагрузок с интенсивным вводом-выводом, требующих высокой производительности и низких задержек, заказчики могут продолжать использовать существующие экземпляры i3en и i4i с гиперконвергентной архитектурой. В целом, благодаря M7i bare metal пользователи VMware Cloud on AWS смогут ускорить перенос нагрузок в облако, сократить время восстановления после сбоев и атак программ-вымогателей, а также повысить эффективность развёртывания приложений ИИ и машинного обучения при снижении совокупной стоимости владения, сообщает компания.
29.11.2023 [12:57], Сергей Карасёв
HPE увеличила чистую годовую прибыль более чем в два разаКомпания Hewlett Packard Enterprise (HPE) опубликовала отчёт о работе в последней четверти и 2023 финансовом году в целом, который был закрыт 31 октября. Поставщик оборудования значительно улучшил показатели чистой прибыли, что объясняется растущим спросом на НРС-платформы и стремительным развитием сегмента ИИ. Квартальная выручка составила $7,35 млрд, что находится в середине собственного прогнозного диапазона HPE. Однако это примерно на 7 % меньше прошлогоднего результата, когда компания получила $7,87 млрд. Чистая прибыль составила $642 млн, тогда как годом ранее были продемонстрированы чистые убытки в размере $304 млн. Подразделение Intelligent Edge, отвечающее в числе прочего за продажи продукции для Интернета вещей и сетевой бизнес Aruba, принесло $1,36 млрд, что на 41 % больше, чем годом ранее. Выручка в сегменте ИИ и высокопроизводительных вычислений (HPC & AI) составила $1,18 млрд — это на 37 % больше по сравнению с III четвертью 2022 финансового года. В сфере СХД квартальный объём продаж составил $1,1 млрд, что на 13 % меньше, чем годом ранее. Поступления от платформ для вычислений упали на 31 % год к году — до $2,6 млрд. По итогам 2023 финансового года в целом HPE показала выручку в размере $29,14 млрд против $28,50 млрд в 2022-м. Таким образом, рост оказался на отметке 2 %. При этом чистая прибыль подскочила более чем в два раза — с $868 млн до $2,03 млрд. Годовая выручка подразделения Intelligent Edge поднялась на 42 %, достигнув $5,20 млрд. Бизнес HPC & AI принёс $3,91 млрд, что на 23 % больше прошлогоднего результата. По направлению СХД продажи зафиксированы на отметке $4,42 млрд — минус 4 % год к году. Выручка в сегменте вычислений сократилась на 11 %, составив $11,44 млрд. В I квартале 2024 финансового года HPE ожидает показать выручку от $6,9 до $7,3 млрд, а чистая прибыль составит от 42 до 50 центов на акцию. В целом, в 2024 финансовом году компания намерена получить прибыль от $1,82 до $2,02 на ценную бумагу.
29.11.2023 [12:52], Сергей Карасёв
Квартальная прибыль NetApp рухнула втрое, выручка тоже сократиласьКомпания NetApp, специализирующаяся на разработке решений для хранения и управления данными, раскрыла показатели деятельности во II четверти 2024 финансового года, которая была закрыта 27 октября. По ключевым показателям зафиксирована отрицательная динамика. За трёхмесячный период NetApp получила $1,56 млрд выручки против $1,66 млрд годом ранее. Таким образом, зафиксировано сокращение на 6 %. Чистая прибыль рухнула более чем в три раза — с $750 млн до $233 млн. Прибыль в пересчёте на одну ценную бумагу составила $1,10 против $3,41 во II квартале 2023 финансового года. ![]() Источник изображения: NetApp Отмечается, что основная часть выручки NetApp теперь поступает от облачных услуг благодаря партнёрству с такими крупными провайдерами, как Amazon Web Services (AWS), Google Cloud и Microsoft Azure. Причём публичное облако сейчас составляет около десятой части доходов NetApp. В сегменте гибридного облака выручка оказалась на отметке $1,41 млрд, что меньше прошлогоднего результата в $1,52 млрд. Сервисы публичного облака принесли $154 млн, тогда как во II четверти предыдущего финансового года показатель равнялся $142 млн, а показатель ARR вырос с $603 до $609 млн. Для флеш-массивов показатель ARR в годовом исчислении увеличился на 1 % — с $3,1 млрд до $3,2 млрд. По итогам III четверти 2024 финансового года NetApp рассчитывает получить выручку от $1,51 млрд до $1,67 млрд, тогда как чистая прибыль прогнозируется в диапазоне от $1,17 до $1,27 в пересчёте на одну ценную бумагу. По итогам года в целом ожидается прибыль в размере $4,15–$4,35 на акцию.
29.11.2023 [09:09], Алексей Степин
Экологичные GPU-серверы: HOSTKEY развернула новую площадку в Исландии на базе «зелёного» ЦОД Verne GlobalКомпания HOSTKEY, оказывающая услуги по размещению, аренде и обслуживанию серверного оборудования, объявила о запуске новой хост-площадки, на этот раз не совсем обычной. Речь идёт о дата-центре Verne Global уровня Tier III в Исландии, полностью запитанному от возобновляемых источников энергии. Благодаря тому, что исландский ЦОД питается исключительно от ГЭС и геотермальных станций с низкой стоимостью электроэнергии, а относительно низкая «забортная» температура упрощает и удешевляет охлаждение, его можно назвать действительно «зелёным». Сочетание этих качеств позволяет без лишних затрат размещать в ЦОД мощные серверы, в том числе с ускорителями для ИИ и HPC-задач. Собственно говоря, именно это теперь и предлагает HOSTKEY, причём, как и прежде, она готова принимать оплату в рублях. Речь идёт о серверах — как выделенных (VDS), так и виртуальных (VPS) — с графическими ускорителями. В настоящее время сообщается только о решениях NVIDIA, но спектр доступных GPU достаточно широк — в него входят как игровые видеокарты GeForce RTX 3080/3090/4090, так и профессиональные RTX A4000/A5000/A6000. Некоторые конфигурации включают до четырёх GPU, в том числе с NVLink-подключением. Объём оперативной памяти стартует с отметки 32 Гбайт (VPS) и может достигать 384 Гбайт (выделенный сервер), количество выделенных ядер в VPS-варианте — от 8. Все системы оснащены SSD, а в старших конфигурациях предлагаются NVMe-накопители. В зависимости от конфигурации в системе могут быть использованы процессоры Intel Core i9, AMD Ryzen или AMD EPYC. Доступны индивидуальные конфигурации, а выделенные серверы оснащены IPMI. ![]() Источник: Verne Global Кроме того, есть и традиционные VPS без ускорителей: 1–32 ядра (Intel Xeon E5-26xx или Cascade Lake-SP Refresh 6226R), 1–32 Гбайт RAM, 15–480 Гбайт SSD (в том числе NVMe). Время развёртывания для VPS, по словам HOSTKEY, начинается от 15 минут, а для выделенных вариантов со сложной конфигурации оно не превышает 4 часов. GPU-серверам по умолчанию полагается подключение 1 Гбит/с и 50 Тбайт трафика ежемесячно, а обычным VPS — такое же подключение, но только 3 Тбайт трафика. Как и во всех других регионах, в Исландии доступен маркетплейс, который позволяет быстро развернуть различное ПО. ЦОД Verne Global оснащён системой резервного питания по схеме N+1, предусмотрено двойное резервирование (2N) от источника питания до стойки. Также Verne Global говорит, что на площадке развёрнуты высокочувствительная система HSSD/VESDA с газовым тушением, система круглосуточного наблюдения и обнаружения вторжения, а также предусмотрен зональный контроль доступа. Кампус подключён к кабельным системам DANICE, FARICE-1, Greenland Connect, Hibernia Express, Iceland Connect и Sea-Me-We 5. Заявлена защита от DDoS-атак.
29.11.2023 [03:43], Владимир Мироненко
AWS представила 96-ядерный Arm-процессор Graviton4 и ИИ-ускоритель Trainium2Amazon Web Services представила Arm-процессор нового поколения Graviton4 и ИИ-ускоритель Trainium2, предназначенный для обучения нейронных сетей. Всего к текущему моменту компания выпустила уже 2 млн Arm-процессоров Graviton, которыми пользуются более 50 тыс. клиентов. «Graviton4 представляет собой четвёртое поколение процессоров, которое мы выпустили всего за пять лет, и это самый мощный и энергоэффективный чип, который мы когда-либо создавали для широкого спектра рабочих нагрузок», — отметил Дэвид Браун (David Brown), вице-президент по вычислениям и сетям AWS. По сравнению с Graviton3 новый чип производительнее на 30 %, включает на 50 % больше ядер и имеет на 75 % выше пропускную способность памяти. Graviton4 будет иметь до 96 ядер Neoverse V2 Demeter (2 Мбайт L2-кеша на ядро) и 12 каналов DDR5-5600. Кроме того, новый чип получит поддержку шифрования трафика для всех своих аппаратных интерфейсов. Процессор изготавливается по 4-нм техпроцессу TSMC и, вероятно, имеет чиплетную компоновку. Возможно, это первый CPU компании, ориентированный на работу в двухсокетных платформах. Поначалу Graviton4 будет доступен в инстансах R8g (пока в статусе превью), оптимизированных для приложений, интенсивно использующих ресурсы памяти — высокопроизводительные базы данных, in-memory кеши и Big Data. Эти инстансы будут поддерживать более крупные конфигурации, иметь в три раза больше vCPU и в три раза больше памяти по сравнению с инстансами Rg7, которые имели до 64 vCPU и 512 Гбайт ОЗУ. В свою очередь, Trainium 2 предназначен для обучения больших языковых моделей (LLM) и базовых моделей. Сообщается, что ускоритель в сравнении с Trainium 1 вчетверо производительнее и при этом имеет в 3 раза больший объём памяти и в 2 раза более высокую энергоэффективность. Инстансы EC2 Trn2 получат 16 ИИ-ускорителей с возможностью масштабирования до 100 тыс. единиц в составе EC2 UltraCluster, которые суммарно дадут 65 Эфлопс, то есть по 650 Тфлопс на ускоритель. Как утверждает Amazon это позволит обучать LLM с 300 млрд параметров за недели вместо месяцев. Со временем на Graviton4 заработает SAP HANA Cloud, портированием и оптимизацией этой платформы уже занимаются. Oracle также перенесла свою СУБД на Arm, а заодно перевела все свои облачные сервисы на чипы Ampere, в которую в своё время инвестировала. Microsoft же пошла по пути AWS и недавно анонсировала 128-ядерый Arm-процессор (Neoverse N2) Cobalt 100 и ИИ-ускоритель Maia 100 собственной разработки. Всё это может представлять отдалённую угрозу для AMD и Intel. С NVIDIA же все всё равно пока что продолжают дружбу — именно в инфраструктуре AWS, как ожидается, появится самый мощный в мире ИИ-суперкомпьютер на базе новых GH200.
29.11.2023 [01:21], Руслан Авдеев
Cerebras, критиковавшая NVIDIA за сотрудничество с Китаем, сама оказалась связана с компанией, ведущей дела с ПекиномХотя стартап Cerebras, занимающийся разработкой чипов, раскритиковал NVIDIA за попытки обойти санкционные ограничения в отношении Китая и призвал соблюдать не букву, но дух американского закона, у компании, похоже, нашлись свои скелеты в шкафу. Как сообщает The Register, сейчас в США расследуют деятельность клиента Cerebras — группы G42, возможно, помогавшей Поднебесной обходить санкционные ограничения. Американские спецслужбы подозревают, что базирующаяся в ОАЭ многопрофильная компания G42 поставляет в Китай передовые технологии. Для своих ИИ-исследований компания обратилась к Cerebras с целью постройки суперкомпьютерного кластера Condor Galaxy за $100 млн, а всего стартап намерен построить девять подобных объектов на $900 млн. При этом узлы кластера используют разработанные Cerebras чипы WSE-2, подходящие для обучения ИИ-систем. ![]() Источник изображения: Arthur Wang/unsplash.com Как показывают предварительные результаты расследования американских журналистов, властей и спецслужб, G42 пытается сотрудничать с Пекином и работает с китайскими компаниями вроде Huawei, давно находящимися под санкциями. В самой G42 утверждают, что принимают все меры для того, чтобы соблюдать американские ограничения. При этом, по данным журналистов, G42 считают прокси-компанией для работы в интересах КНР, помогающей Пекину получать вычислительные ресурсы и подсанкционные технологии. По словам главы Cerebras Эндрю Фельдмана (Andrew Feldman), его компания точно не будет вести бизнес с Китаем. Бизнесмен попал в неловкую ситуацию после того, как появилась информация о тесных связях G42 с Пекином. На запрос журналистов в Cerebras заявили, что кластеры Condor Galaxy находятся в США, а G42 получает к ним облачный доступ, так что любая активность контролируется и соответствует американским законам — государства-противники не имеют прямого доступа к ИИ-системам. Фельдман якобы не знал о сомнительном статусе G42, а в стартапе подчеркнули, что не комментируют слухи. Бюро промышленности и безопасности США уже обратилось к поставщикам облачных инфраструктур для консультаций о целесообразности дополнительных ограничений доступа к их услугам из некоторых стран. В частности, бюро интересует, как операторы намерены выявлять разработчиков ИИ-моделей, вызывающих обеспокоеность властей и что можно предпринять для устранения угроз. Кроме того, президент США предложил новые правила, согласно которым облакам потребуется докладывать о деятельности иностранцев, связанной с обучением больших языковых моделей (LLM).
28.11.2023 [22:20], Игорь Осколков
NVIDIA анонсировала суперускоритель GH200 NVL32 и очередной самый мощный в мире ИИ-суперкомпьютер Project CeibaAWS и NVIDIA анонсировали сразу несколько новых совместно разработанных решений для генеративного ИИ. Основным анонсом формально является появление ИИ-облака DGX Cloud в инфраструктуре AWS, вот только облако это отличается от немногочисленных представленных ранее платформ DGX Cloud тем, что оно первом получило гибридные суперчипах GH200 (Grace Hoppper), причём в необычной конфигурации. ![]() Изображения: NVIDIA В основе AWS DGX Cloud лежит платформа GH200 NVL32, но это уже не какой-нибудь сдвоенный акселератор вроде H100 NVL, а целая, готовая к развёртыванию стойка, включающая сразу 32 ускорителя GH200, провязанных 900-Гбайт/с интерконнектом NVLink. В состав такого суперускорителя входят 9 коммутаторов NVSwitch и 16 двухчиповых узлов с жидкостным охлаждением. По словам NVIDIA, GH200 NVL32 идеально подходит как для обучения, так и для инференса действительно больших LLM с 1 трлн параметров. Простым перемножением количества GH200 на характеристики каждого ускорителя получаются впечатляющие показатели: 128 Пфлопс (FP8), 20 Тбайт оперативной памяти, из которых 4,5 Тбайт приходится на HBM3e с суммарной ПСП 157 Тбайтс, и агрегированная скорость NVLink 57,6 Тбайт/с. И всё это с составе одного EC2-инстанса! Да, новая платформа использует фирменные DPU AWS Nitro и EFA-подключение (400 Гбит/с на каждый GH200). Новые инстансы, пока что безымянные, можно объединять в кластеры EC2 UltraClasters. Одним из таких кластеров станет Project Ceiba, очередной самый мощный в мире ИИ-суперкомпьютер с FP8-производительность 65 Эфлопс, объединяющий сразу 16 384 ускорителя GH200 и имеющий 9,1 Пбайт памяти, а также агрегированную пропускную способность интерконнекта на уровне 410 Тбайт/с (28,8 Тбайт/с NVLink). Он и станет частью облака AWS DGX Cloud, которое будет доступно в начале 2024 года. В скором времени появятся и EC2-инстансы попроще: P5e с NVIDIA H200, G6e с L40S и G6 с L4. |
|