Непрерывность бизнеса в эпоху COVID-19

Уже почти год мир живет в эпоху пандемии COVID-19, которая затронула практически все аспекты жизни, в том числе и бизнес. Этот год наглядно продемонстрировал, что стабильность IT-инфраструктуры стала одним из определяющих факторов непрерывности бизнеса, однако до сих пор далеко не все понимают, как ее организовать или «довести до ума». О том, что такое непрерывность бизнеса, и как ее грамотно планировать — в тексте крупнейшего латвийского IT-интегратора, работающего и в Украине — Tet (ранее Lattelecom).

непрерывность

С чем столкнулся бизнес в условиях пандемии

Массовый переход в онлайн, с одной стороны, вывел бизнес на совершенно другой уровень. В то же время мы видим по рынку, что возросла и угроза остановки бизнес-деятельности из-за сбоев в IT-системах. Ситуация обостряется и высокой конкуренцией в онлайн-среде: если бизнес-процессы (например, обработка заказа клиента) замедляются даже ненадолго, клиенту ничего не стоит обратиться к услугам другой компании.

Важным фактором в условиях пандемии стало и планирование бюджетов. Часто бизнес является не готовым к неожиданным сбоям в IT-системах и возрастающим нагрузкам на IT-инфраструктуру. Результат — несвоевременное выделение средств на закупку и развертывание серверов. Это приводит к замедлению бизнес-процессов.

Обеспечить стабильную и оперативную работу предприятия в любых условиях позволяет планирование непрерывности бизнеса (Business Continuity Planning). Однако несмотря на то, что эта практика была обязательной для компаний и до COVID-19, реальная ситуация оказалась другой. Согласно опросу Gartner, только 12% предприятий заявили, что были готовы к кризису во время пандемии. Бизнес не мог предвидеть сложности такого масштаба, и коронавирус выявил слабые места в программах непрерывности компаний по всему миру.

О важности плана аварийного восстановления

Из-за увеличения нагрузки на IT-инфраструктуру нарушения в работе онлайн-систем становятся все более распространенными, а убытки — более серьезными. Ключевой практикой борьбы с IT-сбоями является разработка плана аварийного восстановления (Disaster Recovery Plan, DR-план) — залога непрерывности бизнес-процессов.

Хорошо продуманный DR-план позволяет предусмотреть и снизить последствия большинства IT-сбоев, включая:

  • отказы оборудования;
  • нарушения в работе программного обеспечения;
  • повреждение или потерю данных;
  • внешние угрозы кибербезопасности;
  • случайные ошибки сотрудников.

Прежде чем заняться разработкой DR-плана, компании следует проанализировать цели бизнеса и их приоритетность. Также необходимо определить, какие сервисы критичны для конкретного бизнес-процесса и в какой последовательности их следует восстанавливать. Только после такого анализа, который еще называют Business Impact Analysis, есть смысл выбирать конкретные инструменты аварийного восстановления.

В условиях массового перехода в онлайн преимущество получают компании, которые занялись разработкой DR-плана заранее. Пример — латвийский IT-интегратор Tet.

«Нам план помог в марте 2020-го года перейти на дистанционную работу фактически за один день. В докоронавирусное время руководство компаний нередко пренебрегало планом аварийного восстановления, опасаясь «ненужных», по их мнению, расходов. Но в условиях пандемии ситуация меняется — внедрение DR-планов становится общепринятой практикой для любого бизнеса», — отмечает Аркадий Рапопорт, менеджер продуктов дата-центров компании.

Свою роль в популяризации планов «спасения бизнеса» сыграли и облачные технологии. С их помощью компаниям удалось оптимизировать ресурсы и время на разработку DR-решений.

«По нашим прогнозам, в 2021 году на сектор облачных услуг будет приходиться 24% от всех бюджетных расходов на IT. Рост очевиден — в 2019 году на облако компании выделяли около 21%», — добавляет А. Рапопорт.

cloud

Какие существуют инструменты аварийного восстановления?

Резервное копирование или «бэкап» (backup) — это создание копий данных на дополнительном носителе информации (в облачном хранилище, на внешнем жестком диске, ленте и т.д.). Оно необходимо для восстановления данных, которые повредились или разрушились в основном месте их хранения.

Решения резервирования должны полностью отвечать потребностям компании, позволяя создавать автоматизированные планы резервного копирования. С помощью бэкапа утраченную информацию можно восстановить в любой момент хранения данных, даже если пропажу файла не заметили сразу. Резервное копирование проводится регулярно, обычно раз в сутки ночью, что позволяет сэкономить время и силы.

Тем не менее, для полного сохранения непрерывности бизнеса одним бэкапом не обойтись. Во-первых, он занимает время — системы для создания резервных копий срабатывают постепенно, из-за чего не могут быстро возобновить работу сервисов. Во-вторых, в случае сбоя компании все равно нужна IT-инфраструктура, куда можно перенести IT-системы. Иными словами, бэкап не предоставляет площадку, где можно продолжить работу во время настройки основного устройства. В-третьих, при резервном копировании данным нужно время для восстановления — в зависимости от объема информации это может занять часы или даже дни. И, наконец, может случиться так, что последняя резервная копия не будет пригодной для восстановления. В таком случае придется восстанавливаться из предыдущей, а это потеря данных и дополнительная трата времени.

Для оценки работы системы бэкапа используют специальные показатели. Это RPO (recovery point objective) — время, в течение которого действует актуальность данных. А также RTO (recovery time objective) — промежуток времени, необходимого для восстановления информации. Эти параметры зависят от задач бизнеса, поэтому для каждой компании они индивидуальны.

Чтобы обеспечить дееспособность бизнеса и сохранить все данные, резервное копирование нужно использовать в комплексе с системами аварийного восстановления (Disaster Recovery). Это решение позволяет восстановить работу операционной системы и программного обеспечения после сбоя оборудования или потери данных.

С помощью системы аварийного восстановления инфраструктуру компании можно «спасти» максимально быстро. Система может работать даже в экстремальных условиях, когда показатели RPO равны нулю, а RTO — занимают несколько минут. Следовательно, аварийное восстановление — это спасение от длительного простоя. Но следует помнить, что, в отличие от резервного копирования, это решение не обеспечивает безопасность данных.

Аварийное восстановление как сервис (Disaster Recovery as a Service, DRaaS) предполагает, что существует резервная IT-площадка, идентичная основной инфраструктуре компании. Расходы на данный сервис от провайдера зачастую значительно ниже по сравнению с созданием собственного «зеркала». Если клиент активно не использует резервную площадку, то платит только за сетевые компоненты и дисковое пространство, которое использует И не несет расходы за вычислительные мощности (vCPU, vRAM). На эту площадку непрерывно копируются данные клиента с его продукционной инфраструктуры. В случае аварии происходит переключение на облачную инфраструктуру, и сервера запускаются уже с нее. Обычно IT-специалисты предприятия сами создают виртуальные машины и настраивают внутренние сети. Но, при необходимости, с этим поможет справиться облачный провайдер.

Итог: чтобы обезопасить себя в эпоху COVID-19, компаниям следует уделить особое внимание планированию непрерывности бизнеса. Однако важно помнить, что спасти бизнес-процессы может только комплексный подход. Так, бэкап поможет сохранить данные в случае сбоя, а система аварийного восстановления — свести к минимуму время простоя. Компании, которые заранее позаботились о будущем, смогут пережить любую аварию, не выходя из строя. Результат — репутация надежного бизнеса и довольные клиенты.

Читайте обзоры:

-->