RTO и RPO: отличия в показателях резервного копирования

Обучение

14.03.2023

В 2017 году американское бюро кредитной истории Equifax стало жертвой кибератаки. Произошла утечка более 140 миллионов персональных данных пользователей. Впоследствии компания признала, что не сделала достаточное количество резервных копий и не смогла быстро возобновить работу. Как результат, стала предметом судебных разбирательств и потеряла доверие клиентов.

Что такое показатели RTO и RPO и как они спасают в любых форс-мажорных ситуациях, рассказываем ниже.

Что такое RTO

RTO (Recovery Time Objective) ― показатель времени восстановления. Это время, необходимое для восстановления данных после аварии. То есть, компания имеет определенный период времени, в течение которого ей нужно возобновить работу, прежде чем клиенты начнут «бить тревогу».

На этот показатель влияют многие параметры: количество виртуальных машин или физических хостов, для которых создаются бэкапы, программное обеспечение, размер дисковых массивов и тип дисков, используемых для хранения данных, площадка хранения бэкапов. А также место точки обновления в цепи резервных копий.

RTO учитывает шаги, которые IT-команда должна предпринять для возврата функционирования сервисов и данных. Если бизнес использует современные системы, оборудование и резервирует его, можно вычислить показатель в секундах.

Что такое RPO

RPO (Recovery Point Objective) ― показатель точки восстановления, промежуток времени между сохраненными резервными копиями. Это максимальное время, в течение которого могут быть потеряны данные в объеме, не критичном для функционирования бизнеса. К примеру, если этот параметр составляет один час, то в случае аварии компания восстановит данные, созданные не более чем за час до ее возникновения.

Если вы создаете бэкапы каждые 24 часа, то в самом худшем случае потеряете всю новую информацию, сгенерированную за этот период. Следует учитывать этот момент при построении бэкап-плана. Современное программное обеспечение позволяет делать резервное копирование с минимальными промежутками времени, такие как 5 минут.

Все сохраненные резервные копии ― неотделимая часть цепи резервного копирования. Сохраняются согласно принципу иерархии времени, где есть бэкапы, которые создаются каждый день, неделю, месяц и год.

Предположим, RPO = 15 и RTO = 10, то максимально возможная потеря информации будет составлять 15 минут, а будет восстановлена максимум за 10.

Чтобы лучше понять эти параметры, проведем аналогию с ситуацией на дороге. RTO сравним со временем, необходимым для продолжения привычного движения после того, как на перекрестке столкнулись два автомобиля. Если пробка продлится 15 минут ― нестрашно. Задержка в более чем час приведет к тому, что остальные участники дорожного движения опоздают в офис, больницу или на празднование дня рождения. RPO можно сравнить с максимальным временем, в течение которого могут возникать непредвиденные события на дороге, без значительных последствий безопасности для водителей и пассажиров.

Основные отличия между RTO и RPO

Оба показателя требуют комплексного планирования и проактивного мышления по безопасности. Однако существует несколько существенных отличий.


RTO RPO
Сосредотачивается на доступности сервисов и данных Фокусируется на частоте бэкапирования и допустимых потерях информации
Учитывает все аспекты IT-инфраструктуры и резервного копирования Оценивает критичность данных и стоимость бэкапирования
Полагается на best practice в построении отказоустойчивой инфраструктуры и мониторинге Полагается на автоматизацию благодаря программному обеспечению
Сложный процесс, поскольку включает больше подвижных частей и переменных (горячие и холодные площадки, место восстановления, скорость реагирования на инцидент и т.д.) Легче рассчитать, поскольку этот показатель охватывает только один аспект ― данные


Вместе они позволяют узнать, на какой срок вы можете позволить себе прерывание процессов и насколько актуальными будут данные.

Важно: чем короче RTO или RPO, тем больше стоимость процесса, и наоборот.

Как рассчитать и достичь желаемого RTO

Для начала определите наиболее критические программы и системы. Для этого выясните:

  • Какие сервисы должны быть постоянно доступны клиентам (сайт, приложение) и работникам (ERP, CRM).
  • Количество данных, потери которых не будут иметь критических последствий для работы бизнеса.
  • Необходимые политики хранения резервных копий по принципу иерархии времени: ежедневные, еженедельные, ежемесячные и ежегодные.

Заранее установите реалистичные ожидания и сделайте следующее:

  • Соберите сильную IT-команду.
  • Инвестируйте в лучшее программное обеспечение для резервирования. Если вы используете устаревшее решение, скорее всего, потребуется внедрение современной платформы для бэкапирования.
  • Улучшите работу критически важных сервисов. Когда у технических специалистов постоянно возникают проблемы при настройке работоспособности сервисов, возможно, сам код требует доработки.
  • Настройте оповещения в режиме реального времени. Они предоставляют обратную связь, когда в приложении возникают проблемы. Уведомления должны поступать в персонал через специальные платформы и устройства.
  • Внедрите высокопроизводительный план резервного копирования.
  • Ограничьте низкий RTO только несколькими приложениями. Большинство организаций не могут поддерживать очень короткое время восстановления для всех систем. Создавать и хранить резервные копии каждые несколько часов для каждой программы достаточно дорого.

Как рассчитать и реализовать необходимый RPO

Чтобы определить, какой объем информации будет потерян без значительного ущерба, следуйте этим рекомендациям и выберите временные диапазоны для всех важных систем.

  • Проведите тесты, чтобы определить, как быстро нужно восстановить каждую корпоративную программу, включая облачные платформы, CRM-решения и приложения для электронной коммерции.
  • Распределите все основные корпоративные программы по приоритетности. Определите, какая информация нужна через несколько минут, а какая может подождать час или день.
  • Рассчитайте бюджет, который вы готовы потратить на использование сервиса резервного копирования. Выясните, какие программы будете восстанавливать в первую очередь.

Четыре способа реализации Recovery Point Objective

  • Будьте реалистами. Если установили показатель шесть часов, убедитесь, что у вас достаточно места для хранения нужного количества резервных копий.
  • Научите персонал. Все специалисты, вовлеченные в процесс бэкапирования, должны уметь быстро и оперативно реагировать на инциденты, сбои в работе.
  • Модернизируйте технологии. Убедитесь, что вы используете современные инструменты для резервирования. К примеру, Veeam Backup & Replication, предназначенный для широкого спектра сред, включая виртуальные инфраструктуры и платформы SaaS.
  • Оптимизируйте сети. Когда сеть перегружена, появляется риск не справиться с резервным копированием.

Оба параметра важны в процессе аварийного восстановления. Их понимание помогает компаниям построить эффективные и надежные решения, которые смогут защитить их от потенциальных потерь и ущерба, вызванных с форс-мажорами.

Если вы интересуетесь этой темой, рекомендуем разобраться в чем разница между бэкапом, снапшотом и репликацией.

subscribe

Подписаться на новости

Оставьте свой Email, и будьте всегда в курсе свежих новостей!