Материалы по тегу: авария

16.03.2020 [15:12], Алексей Степин

Авария в ЦОД Google: потеря колеса опасна не только в Формуле-1

Современная серверная инфраструктура чрезвычайно сложна и, зачастую, не менее капризна. Причин, могущих вызывать проблемы, множество — от очень сложных до простейших. Но этот случай, пожалуй, является одним из самых экзотических: перебои в работе Google Cloud были вызваны тем, что у стойки, в которой размещалось оборудование, сломались колёсики.

Компания отчиталась об инциденте и постарается избежать подобных проблем в будущем.

Проблемная стойка: виден наклон вперёд

Проблемная стойка: виден наклон вперёд

Инцидент произошёл совсем недавно. Некоторые серверы Google Cloud стали работать с перебоями — процессоры уходили в троттлинг, что приводило к потере пакетов. Казалось бы, налицо отказ системы охлаждения, явление, которое в масштабах центров обработки данных Google время от времени должно происходить просто в силу статистики. Однако высланная на место аварии команда инженеров (site reliability engineering, SRE) обнаружила совсем иную картину.

Виновники аварии

Виновники аварии

Под весом оборудования, установленного в «проблемную» стойку, сломались пластиковые колёсики. Стойка наклонилась вперёд, что нарушило нормальную циркуляцию теплоносителя в системах жидкостного охлаждения — и некоторые процессоры стали перегреваться, включая при достижении критической температуры режим троттлинга.

По всей видимости, случай с колёсиками не первый, поскольку с момента инцидента Goolge начала периодически заменять аналогичные стойки, следуя своему принципу «любая авария происходит только один раз». Подробнее инцидент описан в официальном блоге Google Cloud.

Постоянный URL: http://servernews.ru/1006035
04.11.2015 [11:44], Андрей Крупин

На подводной линии связи между Россией и Финляндией произошла авария

Телекоммуникационный оператор «Ростелеком» сообщил об аварии на подводной волоконно-оптической линии связи (ВОЛС) между Россией и Финляндией и проинформировал своих абонентов о возможных затруднениях с доступом к сетевым ресурсам.

«В настоящее время наблюдается авария на подводной сети связи между Россией и Финляндией. Для производства ремонтных работ к месту аварии вышло кабельное судно. Возможны затруднения с доступом к зарубежным европейским ресурсам до завершения работ на сети», — говорится на сайте крупнейшего российского интернет-провайдера. О причинах возникших технических неисправностей на магистральном канале и сроках их устранения не сообщается.

Источник, близкий к компании, сообщил «Интерфаксу», что речь идёт о линии связи одного из зарубежных партнёров «Ростелекома». С целью минимизации проблем с доступом к зарубежным интернет-ресурсам, оператор организовал резервные каналы передачи данных.

Общая протяжённость магистральной сети «Ростелекома» составляет более 40 тыс. км., пропускная способность достигает 1 Тбит/с, ёмкость внешних каналов составляет 200 Гбит/с. Компания также присутствует на зарубежных узлах — в Стокгольме, Лондоне, Гонконге, Франкфурте, Амстердаме. Огромное внимание российский оператор в настоящее время уделяет строительству подводной ВОЛС «Камчатка — Сахалин — Магадан» протяжённостью около двух тысяч километров. 

Материалы по теме:

Источники:

Постоянный URL: http://servernews.ru/923019
Система Orphus