Материалы по тегу: nvidia

12.04.2019 [18:08], Сергей Тверье

Fortran-компилятор NVIDIA F18 принят в LLVM

Fortran — один из первых языков высокого уровня, но он до сих пор активно используется в высокопроизводительных вычислениях наряду с C++ и Python. Инженеры NVIDIA уже продолжительное время работают над компилятором языка Fortran с открытым исходным кодом — Flang, созданным поверх инфраструктуры LLVM и вдохновленным компилятором Clang C/C++.

Компилятор Fortran F18 — переписанный инженерами NVIDIA на С++ Flang, теперь проект будет развиваться в составе инфраструктуры LLVM

Компилятор Fortran F18 — переписанный инженерами NVIDIA на С++ Flang, теперь проект будет развиваться в составе инфраструктуры LLVM

Не так давно разработчики из NVIDIA приступили к переписыванию проекта с языка C на C++, новый проект получил название F18. F18 поддерживает большую часть возможностей Flang, полностью реализует версию языка Fortran 2018, а также поддерживает OpenMP 4.5 для параллельного программирования.

NVIDIA изначально хотела, чтобы новый компилятор стал частью проекта LLVM и развивался на базе его инфраструктуры, но принятие этого решения затянулось на длительный срок, и судьба F18 оставалась неопределённой. И вот на днях в рассылке проекта LLVM, один из его основателей и ведущих разработчиков Крис Латтнер, сообщил, что разработчики приняли решение принять новый компилятор в свою «‎семью»‎.

NVIDIA давно использует LLVM и в частности Fortran в рамках архитектуры CUDA

NVIDIA давно использует LLVM и в частности Fortran в рамках архитектуры CUDA

«Наше сообщество обсудило вопрос о том, следует ли принимать компилятор и среду выполнения Fortran F18 в состав LLVM, обсуждение прошло на EuroLLVM'19, на котором совет директоров LLVM Foundation одобрил его включение в наш проект», — сообщил Крис.

Команде разработчиков F18 было рекомендовано рассмотреть возможность избавления от функций, завязанных на стандарт C++17, чтобы F18 мог быть быстрее и полнее интегрирован в инфраструктуру LLVM. Тем не менее, это вопрос будущего, так как сейчас F18 только начал своё развитие.

Постоянный URL: http://servernews.ru/985782
09.04.2019 [20:31], Андрей Крупин

REG.RU предложил почасовую оплату облачных вычислений на базе NVIDIA GPU

Регистратор и хостинг-провайдер REG.RU сообщил пересмотре тарифной сетки на услуги сервиса высокопроизводительных GPU-вычислений, предназначенного для решения задач, связанных с искусственным интеллектом, машинным обучением и анализом больших массивов данных. Теперь пользователям стала доступа почасовая оплата облачных вычислений. Ранее заказать услугу можно было только в формате посуточной или помесячной оплаты.

В основу предлагаемого компанией REG.RU сервиса положены GPU-ускорители Tesla V100 с архитектурой NVIDIA Volta, производительность которых в задачах глубокого обучения может достигать 125 терафлопс. Исходя из потребностей пользователя, в рамках услуги можно подключить до 8 вычислительных ускорителей к одному виртуальному контейнеру либо арендовать физический сервер целиком. Через панель управления клиент может самостоятельно разворачивать и удалять серверы, выбирать преднастроенные шаблоны виртуального окружения с Ubuntu или Windows и производить базовые действия с сервисом.

Для максимальной производительности и удобства работы при обучении нейросетей облако REG.RU сделано совместимым с контейнерами NVIDIA GPU Cloud (NGC) — это экономит время пользователя на разворачивании и последующей работе с ПО. Репозиторий NGC обеспечивает свободный доступ к каталогу GPU-ускоренных контейнеров, который включает ведущие фреймворки и оптимизированное NVIDIA программное обеспечение для глубокого обучения, инструменты для HPC-визуализации и сторонние HPC-приложения.

Получить доступ к системе облачных вычислений REG.RU на базе NVIDIA GPU можно по ссылке reg.ru/cloud-services/cloud_gpu. На время бета-тестирования, до 1 июня 2019 года, минимальная стоимость пользования сервисом составляет 90 рублей за час работы.

Материалы по теме:

Источник:

Постоянный URL: http://servernews.ru/985596
09.04.2019 [11:35], Андрей Созинов

NVIDIA RC 18: прототип процессора для глубокого обучения из 36 отдельных кристаллов

Компания NVIDIA работает над созданием нового решения, предназначенного для работы с искусственным интеллектом, которое называется RC 18. Ключевой особенностью данного чипа является то, что он будет представлять собой «склейку» из нескольких кристаллов, то есть станет мультичиповым решением.

Инженеры NVIDIA Research создали прототип процессора, который состоит сразу из 36 модулей. Несмотря на столь большое количество кристаллов, площадь чипа довольно небольшая. Всё дело в том, что кристаллы весьма компактные, хоть и производятся по не самому «тонкому» 16-нм техпроцессу компанией TSMC. Напомним, что по таким же нормам производятся графические процессоры Pascal.

Каждый из 36 модулей состоит из 16 процессорных элементов (Processing Elements, PE), являющихся базовыми процессорными ядрами с архитектурой RISC-V Rocket. Кроме того, у модуля есть буфер памяти и восемь каналов GRS (Ground-Referenced Signaling) для операций ввода/вывода с общей пропускной способностью в 100 Гбайт/с, что весьма немало.

На данный момент RC 18 является скорее экспериментальной разработкой, нежели прототипом некоего готовящегося продукта. Этот многочиповый модуль (Multi-chip module, MCM) предназначен для ускорения глубокого обучения искусственного интеллекта и его главной особенностью является высокий уровень масштабируемости. То есть изменять производительность такого MCM-модуля куда проще, чем чипа с монолитным кристаллом, ведь можно просто добавлять или убирать кристаллы с процессорными элементами.

Чип RC 18 создан для ускорения процесса глубокого обучения, что само по себе не очень интересно для рядовых пользователей. Тем не менее, многие из технологий, которые делают возможным создание и работу данного многочипового модуля, могут найти применение в будущих графических процессорах NVIDIA. Компания ранее уже заявляла о том, что рассматривает варианты создания GPU из нескольких кристаллов. И RC 18 является одним из шагов на пути к этому.

«Этот чип (RC 18 — прим. ред.) обладает таким преимуществом, как способность продемонстрировать сразу множество технологий, — отмечает Билл Дэлли (Bill Dally), глава NVIDIA Research. — Одной из технологий является масштабируемая архитектура для глубокого обучения. Другой является очень эффективная технология интерконнекта на органической основе».

Некоторые из технологий, применённых в RC 18, однажды могут стать ключевыми при создании больших высокопроизводительных графических процессоров из нескольких кристаллов. Например, это может быть ячеистая топология, передача сигналов с малой задержкой с помощью GRS, объектно-ориентированный высокоуровневый синтез (Object-Oriented High-Level Synthesis, OOHLS) и технология GALS (Globally Asynchronous Locally Synchronous).

Заметим, что NVIDIA является не первой компанией, которая планирует создание графического процессора из нескольких кристаллов. Некоторое время назад компания AMD также говорила о том, что её шина Infinity Fabric, используемая в центральных процессорах, может найти применение в области GPU. Однако создание таких графических процессоров сопряжено с рядом трудностей, одна из которых заключается в том, чтобы заставить программное обеспечение воспринимать «склейку» как единый GPU. Иначе получится связка SLI или CrossFire, что для потребительских видеокарт означает не самую высокую эффективность. Но когда-то многочиповые модули могут стать вполне обычным явлением для настольных видеокарт.

Постоянный URL: http://servernews.ru/985537
03.04.2019 [12:10], Сергей Карасёв

SAS и NVIDIA займутся технологиями машинного обучения и компьютерного зрения

Компания SAS объявила о заключении соглашения о сотрудничестве с NVIDIA, предусматривающего развитие технологий искусственного интеллекта (ИИ).

В частности, стороны займутся совместными разработками в сфере машинного обучения, компьютерного зрения и обработки естественного языка.

«Графические процессоры и библиотеки CUDA-X AI от NVIDIA усилят решения на основе искусственного интеллекта от SAS, что позволит повысить скорость обработки данных и сделать их анализ ещё более точным», — отмечается в сообщении партнёров.

В настоящее время системы искусственного интеллекта являются одним из наиболее перспективных направлений развития рынка информационных технологий. Такие платформы востребованы в самых разных сферах — в здравоохранении и фармацевтике, в промышленности, финансах и пр.

Компании, работающие в указанных областях, благодаря сотрудничеству SAS и NVIDIA получат ряд новых преимуществ. Например, медицинские специалисты смогут использовать технологию распознавания объектов, чтобы отличить доброкачественные опухоли от злокачественных. Промышленным предприятиям компьютерное зрение поможет увидеть скрытый брак прямо на конвейере, а финансовые организации сэкономят миллиарды долларов благодаря своевременному обнаружению мошеннических операций.

Новые технологии позволят решать задачи по классификации и распознаванию изображений, обнаружению объектов, перевода речи в текст, определению эмоций и др. Всё это будет способствовать развитию рынка Интернета вещей. 

Постоянный URL: http://servernews.ru/985215
19.03.2019 [11:02], Сергей Карасёв

NVIDIA Jetson Nano: платформа для разработчиков по цене $99

Компания NVIDIA анонсировала комплект для разработчиков Jetson Nano: платформа подходит для реализации различных проектов в сфере робототехники, Интернета вещей и пр.

Комплект включает вычислительный модуль и сопутствующую интерфейсную плату. «Сердцем» служит процессор с четырьмя вычислительными ядрами ARM Cortex-A57, функционирующими на тактовой частоте до 1,43 ГГц. Предусмотрен графический ускоритель с архитектурой NVIDIA Maxwell.

Объём оперативной памяти LPDDR4 составляет 4 Гбайт. Для хранения данных может быть задействована флеш-карта формата microSD.

Среди доступных интерфейсов упомянуты GPIO, I2C, I2S, SPI, UART. Сопутствующая плата позволяет использовать такие разъёмы, как USB 3.0 (×4), HDMI 2.0 и DisplayPort 1.4, Gigabit Ethernet, Micro-USB.

Изделие оборудовано пассивной системой охлаждения на основе радиатора. Более подробная информация о новинке доступна здесь.

Приобрести комплект NVIDIA Jetson Nano можно по ориентировочной цене от 99 долларов США. 

Постоянный URL: http://servernews.ru/984429
11.03.2019 [15:02], Сергей Карасёв

NVIDIA заплатит за Mellanox почти 7 млрд долларов США

Компания NVIDIA официально объявила о заключении сделки по приобретению израильской фирмы Mellanox, которая специализируется на сетевых продуктах для центров обработки данных.

О возможности слияния NVIDIA и Mellanox мы сообщали накануне. Интерес к Mellanox ранее проявляли такие гиганты, как Intel и Microsoft, но прийти к соглашению с руководством Mellanox удалось NVIDIA.

Сообщается, что разработчик графических процессоров заплатит за каждую ценную бумагу Mellanox 125 долларов США. Таким образом, общая сумма сделки составит практически 7 млрд долларов США — 6,9 млрд.

Приобретение Mellanox поможет NVIDIA в развитии направления высокопроизводительных вычислений и оборудования для центров обработки данных.

Reuters

Reuters

Нужно отметить, что NVIDIA и Mellanox сотрудничают уже довольно продолжительное время. Аппаратные решения компаний применяются во многих суперкомпьютерах из списка мощнейших вычислительных систем мира Тор500.

Кроме того, как отмечается, продукты NVIDIA и Mellanox востребованы в сегменте облачных платформ. 

Постоянный URL: http://servernews.ru/984039
10.03.2019 [22:40], Илья Гавриченков

NVIDIA собралась побороться с Intel за покупку компании Mellanox

Согласно сообщению информационного агентства Reuters, компания NVIDIA приняла решение включиться в борьбу за покупку Mellanox – крупного производителя телекоммуникационного оборудования. Из информации, которая циркулировала в отрасли ранее, следовало, что наиболее вероятным кандидатом на покупку Mellanox выступает Intel, которая предлагала заплатить в рамках сделки 6 млрд долларов, но NVIDIA решила перебить ставку микропроцессорного гиганта, предложив сумму как минимум на 10 % выше. Стоит напомнить, что Mellanox приняла решение выставить себя на продажу в октябре 2018 года, и к покупке этой компании успели проявить интерес и другие крупные игроки, например, Microsoft и Xilinx.

Mellanox – израильская компания с капитализацией $5,93 млрд, которая специализируется на сетевых продуктах для центров обработки данных и занимает доминирующее положение как производитель оборудования для сетей Infiniband. Именно по этой причине с покупкой Mellanox могут возникнуть проблемы у Intel. В 2012 году микропроцессорный гигант приобрёл интеллектуальную собственность фирмы QLogic, что позволило ему разработать собственный модельный ряд контроллеров и сетевых коммутаторов Infiniband и стать единственным значимым конкурентом Mellanox. А это значит, что сделке Intel и Mellanox могут воспротивиться регуляторы США и Китая.

Одобрение сделки с NVIDIA представляется более беспроблемным мероприятием. Кроме того, Mellanox может вполне органично вписаться в бизнес NVIDIA: производитель GPU остро нуждается в диверсификации своей деятельности и сокращении зависимости от нестабильных продаж видеокарт. При этом Mellanox неплохо ложится и на взятый NVIDIA курс на покорение рынка оборудования для центров обработки данных.

Впрочем, интерес Intel к Mellanox тоже возник не на пустом месте. Сетевое оборудование Infiniband является ключевым компонентом в сфере суперкомпьютеров и дата-центров, и прибрав к рукам его разработку и производство, Intel может получить существенное преимущество перед конкурентами как поставщик полнофункциональных высокопроизводительных серверных платформ. Расширение сферы интересов в сторону высокоскоростного сетевого оборудования также вписывается и в стратегию Intel по собственной трансформации из компании, построенной вокруг ПК, в компанию более широкого профиля, интересующуюся многими смежными направлениями, включая сети 5G, системы хранения данных, искусственный интеллект и, в числе прочего, высокопроизводительные вычисления (HPC).

На данный момент неизвестно, будет ли Intel продолжать бороться за Mellanox после того, как NVIDIA решила поднять ставки. Также нельзя отметать и возможность того, что в развернувшееся соревнование не включится и какой-нибудь третий участник, например, Microsoft.

Постоянный URL: http://servernews.ru/984006
22.11.2018 [12:50], Андрей Созинов

SC18: Supermicro показала аналог NVIDIA HGX-2 и систему с 320 линиями PCIe

Компания Supermicro также не пропустила выставку SC18 и представила на своём стенде ряд весьма интересных систем и решений. Чего только стоит система, которая обладает 320 линиями PCI Express.

Но начнём с более традиционных систем. Supermicro продемонстрировала универсальное решение X11 SuperBlade высотой 8U, которое предлагает размещение в одном корпусе до десяти полноразмерных блейд-серверов с четырьмя процессорами каждый, и до двадцати блейд-серверов половинной высоты с парами процессоров. В обоих случаях это означает установку до 40 процессоров Intel Xeon Scalable, причём поддерживаются все модели (TDP до 205 Вт).

В свою очередь система с кодовым названием SYS-X029GP-TNVRT представляет собой аналог NVIDIA HGX-2, который построен на той же платформе, но имеет свои особенности. Новинка Supermicro также включает в себя 16 ускорителей вычислений Tesla V100 в исполнении SXM3, которые объединены друг с другом с помощью NVSwitch. Также будет доступен вариант с ускорителями в виде карт PCI Express.

Мостик NVSwitch

Мостик NVSwitch

Помимо ускорителей NVIDIA новая система Supermicro включает в себя пару процессоров Intel Xeon Scalable и до 16 накопителей с интерфейсом NVMe. Собственно, это в первую очередь и отличает её от фирменной системы NVIDIA HGX-2. Хотя предназначение у обеих систем одинаковое: ИИ, HPC и прочие подобные задачи, требующие большой вычислительной мощности.

А вот система Supermicro, способная обеспечить сразу 320 линий PCI Express пока что названия не получила. Данная платформа построена на паре процессоров Intel Xeon Scalable и обладает 20 слотами PCI Express 3.0, каждый из которых работает в режиме x16. Конечно же, у процессоров нет столько линий PCI Express 3.0, поэтому чтобы их обеспечить были использованы PLX-чипы Broadcom 9797.

На данный момент эта платформа позиционируется в качестве решения для ускорителей вычислений NVIDIA Tesla T4. Данные ускорители предназначены для работы с искусственным интеллектом, например, для запуска готовых нейронных сетей для множества клиентов. Заметим, что Supermicro позиционирует свою новинку как универсальную платформу для инференса нейронных сетей, поэтому установить в неё можно будет и другие ускорители, подобные Tesla T4.

Система под Intel Ruler

Система под Intel Ruler

Наконец, были показаны две системы хранения данных, способные работать с «линеечными» твердотельными накопителями. Одна из систем предназначена для установки до 32 накопителей Intel Ruler, например, Intel DC 4500. Другая же способна принять до 36 «линеечных» накопителей Samsung NF-1. Intel готовит накопители типа Ruler объёмом до 32 Тбайт, что в сумме даст 1 Пбайт хранилища в одной системе. У Samsung пока что доступны лишь накопители на 16 Тбайт, что даст также немалые 576 Тбайт на одну систему. Заметим, что оба типа накопителей весьма похожи, и сейчас Intel и Samsung спорят, чей стандарт должен стать индустриальным.

Система под Samsung типа NF-1

Система под Samsung NF-1

Постоянный URL: http://servernews.ru/978550
22.10.2018 [12:21], Сергей Карасёв

Cirrus7 AI-Box: платформа для систем автоматизации и машинного зрения

Для заказа доступна система Cirrus7 AI-Box, использующая связку из аппаратного изделия NVIDIA Jetson TX2 и программной платформы Ubuntu Linux.

Новинка рассчитана на решение задач, связанных с машинным зрением и автоматизацией. Устройство заключено в алюминиевый корпус с габаритами 155 × 120 × 49 мм.

Решение NVIDIA Jetson TX2 включает два вычислительных узла Denver 2 и четыре ядра Cortex-A57. Модуль оснащён 256-ядерным графическим процессором NVIDIA с архитектурой Pascal и 8 Гбайт оперативной памяти LPDDR4.

Вычислительная система Cirrus7 AI-Box оборудована флеш-накопителем eMMC вместимостью 32 Гбайт. Имеется интерфейс HDMI 2.0a с возможностью вывода изображения в формате 4К.

Оснащение включает гигабитный сетевой контроллер и адаптер беспроводной связи Wi-Fi. Для подключения периферии предусмотрены два порта USB 3.0 и один порт USB 2.0.

Важно отметить, что система не производит шума при работе благодаря пассивному охлаждению.

Цена Cirrus7 AI-Box начинается с 969 евро. 

Постоянный URL: http://servernews.ru/977116
15.10.2018 [15:54], Сергей Юртайкин

NVIDIA анонсировала платформу для анализа данных при помощи GPU

NVIDIA анонсировала платформу Rapids, при помощи которой крупные компании могут анализировать огромные массивы данных и делать точные прогнозы для бизнеса, используя возможности графических ускорителей.

Rapids включает набор библиотек с открытым исходным кодом для аналитики и машинного обучения, а позже к ним должны добавиться средства визуализации данных.

В NVIDIA сообщили, что первые испытания Rapids с использованием алгоритма машинного обучения XGBoost на системе Nvidia DGX-2 показали 50-кратное ускорение по сравнению с системами только для CPU. Это позволяет сократить время обучения с нескольких дней до нескольких часов и с нескольких часов до нескольких минут в зависимости от объёма набора данных.

«Взяв за основу CUDA с ее глобальной экосистемой, мы создали платформу GPU-ускорения Rapids в тесном сотрудничестве с разработчиками открытого ПО. Она легко интегрируется в самые распространенные библиотеки обработки данных и существующие процессы для ускорения машинного обучения. Мы разгоняем машинное обучение так же, как мы разгоняли глубокое обучение», — заявил глава NVIDIA Дженсен Хуанг (Jensen Huang).

Отмечается, что новая платформа обеспечивает прирост производительности в таких задачах, как предсказание мошенничества в операциях с кредитными картами, прогноз запаса товаров на складе и прогнозирование покупательского поведения потребителей.

Постоянный URL: http://servernews.ru/976792
Система Orphus