RTO и RPO: отличия в показателях резервного копирования
14.03.2023
В 2017 году американское бюро кредитной истории Equifax стало жертвой кибератаки. Произошла утечка более 140 миллионов персональных данных пользователей. Впоследствии компания признала, что не сделала достаточное количество резервных копий и не смогла быстро возобновить работу. Как результат, стала предметом судебных разбирательств и потеряла доверие клиентов.
Что такое показатели RTO и RPO и как они спасают в любых форс-мажорных ситуациях, рассказываем ниже.
Что такое RTO
RTO (Recovery Time Objective) ― показатель времени восстановления. Это время, необходимое для восстановления данных после аварии. То есть, компания имеет определенный период времени, в течение которого ей нужно возобновить работу, прежде чем клиенты начнут «бить тревогу».
На этот показатель влияют многие параметры: количество виртуальных машин или физических хостов, для которых создаются бэкапы, программное обеспечение, размер дисковых массивов и тип дисков, используемых для хранения данных, площадка хранения бэкапов. А также место точки обновления в цепи резервных копий.
RTO учитывает шаги, которые IT-команда должна предпринять для возврата функционирования сервисов и данных. Если бизнес использует современные системы, оборудование и резервирует его, можно вычислить показатель в секундах.
Что такое RPO
RPO (Recovery Point Objective) ― показатель точки восстановления, промежуток времени между сохраненными резервными копиями. Это максимальное время, в течение которого могут быть потеряны данные в объеме, не критичном для функционирования бизнеса. К примеру, если этот параметр составляет один час, то в случае аварии компания восстановит данные, созданные не более чем за час до ее возникновения.
Если вы создаете бэкапы каждые 24 часа, то в самом худшем случае потеряете всю новую информацию, сгенерированную за этот период. Следует учитывать этот момент при построении бэкап-плана. Современное программное обеспечение позволяет делать резервное копирование с минимальными промежутками времени, такие как 5 минут.
Все сохраненные резервные копии ― неотделимая часть цепи резервного копирования. Сохраняются согласно принципу иерархии времени, где есть бэкапы, которые создаются каждый день, неделю, месяц и год.
Предположим, RPO = 15 и RTO = 10, то максимально возможная потеря информации будет составлять 15 минут, а будет восстановлена максимум за 10.
Чтобы лучше понять эти параметры, проведем аналогию с ситуацией на дороге. RTO сравним со временем, необходимым для продолжения привычного движения после того, как на перекрестке столкнулись два автомобиля. Если пробка продлится 15 минут ― нестрашно. Задержка в более чем час приведет к тому, что остальные участники дорожного движения опоздают в офис, больницу или на празднование дня рождения. RPO можно сравнить с максимальным временем, в течение которого могут возникать непредвиденные события на дороге, без значительных последствий безопасности для водителей и пассажиров.
Основные отличия между RTO и RPO
Оба показателя требуют комплексного планирования и проактивного мышления по безопасности. Однако существует несколько существенных отличий.
RTO | RPO |
---|---|
Сосредотачивается на доступности сервисов и данных | Фокусируется на частоте бэкапирования и допустимых потерях информации |
Учитывает все аспекты IT-инфраструктуры и резервного копирования | Оценивает критичность данных и стоимость бэкапирования |
Полагается на best practice в построении отказоустойчивой инфраструктуры и мониторинге | Полагается на автоматизацию благодаря программному обеспечению |
Сложный процесс, поскольку включает больше подвижных частей и переменных (горячие и холодные площадки, место восстановления, скорость реагирования на инцидент и т.д.) | Легче рассчитать, поскольку этот показатель охватывает только один аспект ― данные |
Вместе они позволяют узнать, на какой срок вы можете позволить себе прерывание процессов и насколько актуальными будут данные.
Важно: чем короче RTO или RPO, тем больше стоимость процесса, и наоборот.
Как рассчитать и достичь желаемого RTO
Для начала определите наиболее критические программы и системы. Для этого выясните:
- Какие сервисы должны быть постоянно доступны клиентам (сайт, приложение) и работникам (ERP, CRM).
- Количество данных, потери которых не будут иметь критических последствий для работы бизнеса.
- Необходимые политики хранения резервных копий по принципу иерархии времени: ежедневные, еженедельные, ежемесячные и ежегодные.
Заранее установите реалистичные ожидания и сделайте следующее:
- Соберите сильную IT-команду.
- Инвестируйте в лучшее программное обеспечение для резервирования. Если вы используете устаревшее решение, скорее всего, потребуется внедрение современной платформы для бэкапирования.
- Улучшите работу критически важных сервисов. Когда у технических специалистов постоянно возникают проблемы при настройке работоспособности сервисов, возможно, сам код требует доработки.
- Настройте оповещения в режиме реального времени. Они предоставляют обратную связь, когда в приложении возникают проблемы. Уведомления должны поступать в персонал через специальные платформы и устройства.
- Внедрите высокопроизводительный план резервного копирования.
- Ограничьте низкий RTO только несколькими приложениями. Большинство организаций не могут поддерживать очень короткое время восстановления для всех систем. Создавать и хранить резервные копии каждые несколько часов для каждой программы достаточно дорого.
Как рассчитать и реализовать необходимый RPO
Чтобы определить, какой объем информации будет потерян без значительного ущерба, следуйте этим рекомендациям и выберите временные диапазоны для всех важных систем.
- Проведите тесты, чтобы определить, как быстро нужно восстановить каждую корпоративную программу, включая облачные платформы, CRM-решения и приложения для электронной коммерции.
- Распределите все основные корпоративные программы по приоритетности. Определите, какая информация нужна через несколько минут, а какая может подождать час или день.
- Рассчитайте бюджет, который вы готовы потратить на использование сервиса резервного копирования. Выясните, какие программы будете восстанавливать в первую очередь.
Четыре способа реализации Recovery Point Objective
- Будьте реалистами. Если установили показатель шесть часов, убедитесь, что у вас достаточно места для хранения нужного количества резервных копий.
- Научите персонал. Все специалисты, вовлеченные в процесс бэкапирования, должны уметь быстро и оперативно реагировать на инциденты, сбои в работе.
- Модернизируйте технологии. Убедитесь, что вы используете современные инструменты для резервирования. К примеру, Veeam Backup & Replication, предназначенный для широкого спектра сред, включая виртуальные инфраструктуры и платформы SaaS.
- Оптимизируйте сети. Когда сеть перегружена, появляется риск не справиться с резервным копированием.
Оба параметра важны в процессе аварийного восстановления. Их понимание помогает компаниям построить эффективные и надежные решения, которые смогут защитить их от потенциальных потерь и ущерба, вызванных с форс-мажорами.
Если вы интересуетесь этой темой, рекомендуем разобраться в чем разница между бэкапом, снапшотом и репликацией.