Top.Mail.Ru
поддержка 24/7
поддержка 24/7

Резервный ЦОД - что это и как работает.


Экспертный материал

Сергей Бондаренко | Руководитель технического отдела


Современный мир невозможно представить без центров обработки данных (далее ЦОД). Это специально спроектированное здание или помещение с высокоэффективными системами кондиционирования, пожаротушения и бесперебойного питания, в котором одновременно работает множество компьютеров, подключённых к высокоскоростной сети. Именно эти компьютеры обеспечивают работу большинства популярных высокотехнологичных сервисов, к которым мы привыкли: сервисы для заказа такси, социальные сети, большинство сайтов, онлайн игры, облачные хранилища и т.д. 

Если работа ЦОДа будет нарушена, то сервисы, которые на нём функционируют, также станут недоступны. Потеря доступа к социальной сети вызовет бурю недовольства среди пользователей, но вряд ли приведёт к серьёзным последствиям, а выход из строя ЦОДа, обеспечивающего регулирование светофоров в городе, подвергнет смертельной опасности всех участников дорожного движения. Поэтому современные дата-центры отличаются очень высоким уровнем отказоустойчивости.

С точки зрения владельца бизнеса, отказ ЦОДа, на который возложены ключевые бизнес-процессы, всегда означает потерю денег, будь то недополученная прибыль, затраты на восстановление работоспособности сервисов, или штрафы за неисполнение обязательств перед заказчиками. Чем выше потенциальные убытки, тем важнее обеспечить беспрерывность работы ИТ-инфраструктуры. 

Что такое резервный ЦОД

Крупные современные ЦОДы очень надёжны. Уровень отказоустойчивости TIER III обеспечивает простой не более 1 часа 36 минут в год и позволяет производить частичный ремонт оборудования без остановки работы сервисов. Однако чреда стечений роковых обстоятельств может вывести из строя даже самые надёжные инженерные решения. 

Для обеспечения отказоустойчивости информационных систем существует резервный центр обработки данных (РЦОД). Это запасная площадка с такими же компьютерами, высокоскоростной сетью и инженерными системами, которая находится в нескольких десятках или даже сотнях километров от основного ЦОДа. На неё копируется виртуальная ИТ-инфраструктура компании, а также с определённой периодичностью реплицируются новые данные с основного дата-центра. При возникновении аварийной ситуации ИТ-инфраструктура частично или полностью продолжает функционировать на оборудовании РЦОДа, обеспечивая непрерывность работы сервисов.

О том, что такое отказоустойчивость ИТ-инфраструктуры, мы писали в статье.

Режимы работы РЦОДа

Резервные дата-центры могут работать в двух режимах: Warm DataCenter (активный/пассивный) или Hot DataCenter (активный/активный).

Основная разница заключается в скорости переключения на резервную инфраструктуру после аварии, а также в версии последней резервной копии данных.

Hot DataCenter подразумевает, что резервная и основная площадки работают параллельно, а репликация данных происходит синхронно. При отказе основной площадки переключение на резервный ЦОД происходит почти незаметно для пользователей. Такой режим работы резервного дата-центра обеспечивает минимальную потерю данных (Recovery Point Objective) и минимальное время восстановления (Recovery Time Objective). Однако поддержание работы Hot DataCenter стоит дороже, поэтому его лучше использовать только для критически важной части ИТ-инфраструктуры, которая должна быть всегда доступна. 

Кроме того, Hot DataCenter позволяет распределить нагрузку между площадками даже при штатном режиме работы. Например, в зависимости от местоположения пользователи могут автоматически подключаться к ближайшему доступному ЦОДу, благодаря чему сервисы будут доступны с минимальной задержкой.

Warm DataCenter копирует данные асинхронно, то есть с определённой периодичностью – раз в день, неделю или с другим интервалом. Такой РЦОД позволяет быстро восстановить работоспособность необходимых сервисов, но часть информации за период между аварией и датой последней резервной копии будет утрачена. Режим Warm DataCenter стоит меньше и подойдёт для резервирования тех сервисов, которые не требуют минимальных показателей RPO и RTO.

Катастрофоустойчивый ЦОД

Катастрофоустойчивость – это способность сохранять работоспособность в условиях экстремальных природных катаклизмов или техногенных аварий. Ураган, взрыв, масштабный пожар или наводнение способны уничтожить здание и основного, и резервного ЦОДа, если они находятся примерно в одном регионе, даже на расстоянии нескольких десятков километров. Поэтому для обеспечения катастрофоустойчивости используют географически распределённые дата-центры, которые находятся на расстоянии сотен или тысяч километров друг от друга. Чем дальше, тем лучше.

При этом благодаря высокоскоростному соединению обе площадки образуют единый кластер, в котором можно свободно перемещать виртуальные машины и использовать общее дисковое пространство. Катастрофоустойчивые дата-центры обеспечивают непрерывное функционирование ИТ-инфраструктуры даже при полном уничтожении одного из ЦОДов.

Облачные вычисления и виртуализация

Современные способы построения ИТ-инфраструктуры основаны на использовании облачных вычислений и виртуализации. Именно благодаря такому подходу можно добиться высоких показателей катастрофоустойчивости и отказоустойчивости с использованием РЦОД.

Облачная инфраструктура (или облака) – это совокупность вычислительных ресурсов, которую можно гибко адаптировать под нужды компании. 

Облака стали возможны благодаря технологии виртуализации.

Виртуализация позволяет на одном физическом сервере разместить несколько операционных систем. Один мощный хост-компьютер распределяет память, ядра процессора и дисковое пространство на несколько сервисов. Например, вместо того, чтобы условные DHCP-сервер, контроллер домена, Сервер 1С, Exchange-сервер работали на отдельных «железках», их можно запустить на одном физическом хосте, но на разных виртуальных машинах. 

У технологии виртуализации много преимуществ перед старым подходом «один хост – один сервер», где операционные системы работали на выделенных физических машинах.

  1. Виртуализация повышает отказоустойчивость. Чем больше отдельных хостов, тем выше вероятность, что что-то сломается. Благодаря виртуализации можно создать отказоустойчивый кластер из нескольких гипервизоров. Тогда при выходе из строя одного из физических хостов, виртуальные машины автоматически мигрируют на рабочий гипервизор в кластере. Такой «переезд» занимает минимум времени и не требует вмешательства системного администратора. 

  2. Виртуализация экономически выгоднее. Во-первых, обслуживать парк из множества отдельных физических серверов дороже. Они потребляют больше электричества, занимают больше места, требуют больший резерв запасных частей и выделяют больше тепла. Во-вторых, если на одном хосте работает лишь один сервис, то большая часть вычислительной мощности будет попросту не задействована. Технология виртуализации позволяет загрузить оборудование вплоть до 80%.

Облака бывают трёх типов: частные, гибридные и публичные.

Построением частных облаков обычно занимаются крупные компании с внушительным бюджетом ИТ-подразделения. Они закупают собственное оборудование, лицензии, содержат штат квалифицированных сотрудников, строят и поддерживают инженерные системы.

Публичные облака строят облачные провайдеры – специализированные компании, которые продают в разном виде вычислительные ресурсы своей облачной инфраструктуры другим компаниям. 

Гибридные облака – одновременное использование публичного и частного облака. Например, компания может построить свою ИТ-инфраструктуру в публичном облаке, но ту часть, к которой предъявляются повышенные требования безопасности, оставить в частном облаке.

Резервный ЦОД, как услуга

Сегодня все больше компаний используют публичные облака, прибегая к услугам облачных провайдеров. Одной из таких услуг является резервный дата-центр или DRaaS (Disaster Recovery as a Service).

Аварийное восстановление инфраструктуры (DRaaS)

Облачный провайдер предоставляет в аренду часть вычислительных мощностей своего оборудования, на которое полностью или частично копируется ИТ-инфраструктура заказчика. Если собственное оборудование заказчика выйдет из строя, то работу можно будет продолжить, переключившись на РЦОД облачного провайдера в считанные минуты. Для большинства компаний услуга резервного ЦОДа экономически выгоднее и надёжнее организации собственного резервного data-center по следующим причинам:

  • отсутствие капитальных затрат;

  • отсутствие затрат на продление лицензий и обновление дорогостоящего оборудования;

  • нет необходимости платить за утилизацию устаревшего оборудования;

  • не нужно нанимать дополнительных квалифицированных сотрудников, знающих, как построить и поддерживать сложную ИТ-инфраструктуру;

  • дата-центры облачных провайдеров соответствуют всем стандартам кибербезопасности;

  • облачные провайдеры используют качественное оборудование и надёжные инженерные системы;

  • публичные облака обладают большим запасом вычислительных мощностей, которые заказчик может подключить в кратчайший срок;

  • облачный провайдер гарантирует, что ИТ-инфраструктура заказчика не будет простаивать дольше времени, оговоренного в SLA (соглашение об уровне сервиса).

Один из ведущих российских облачных провайдеров, предоставляющих услугу резервного ЦОДа, - компания CorpSoft24. Резервное копирование ИТ-инфраструктуры заказчика происходит на геораспределённые катастрофоустойчивые ЦОДы уровня TIER III в РФ и Германии. В случае возникновения аварии, специалисты CorpSoft24 запустят виртуальные серверы заказчика за 15 минут, а также обеспечат минимальную потерю данных (RPO от 5 минут). Когда работоспособность основного дата-центра будет восстановлена, заказчик может вернуться на собственное оборудование. В состав услуги DRaaS от компании CorpSoft24 также входит разработка и тестирование плана восстановления (DRP). Disaster Recovery Plan необходим, чтобы не терять драгоценное время при наступлении аварийной ситуации, и действовать в соответствии со спланированным алгоритмом. Подробнее о DRP вы можете узнать по ссылке

К сожалению, многие компании недооценивают риски, возникающие в случае отказа их собственных серверов. Нередко понимание важности резервирования ИТ-инфраструктуры приходит уже после случившейся аварии, понесённых убытков и испорченной репутации. Услуга резервного ЦОДа от компании CorpSoft24 поможет сохранить деньги и заработать имидж надёжной компании.

Получить доступ к виртуальной инфраструктуре Corpsoft24


Загрузка ...