SLA 99,95%: что это значит и какая ответственность облачного оператора
20.09.2022
Успех сотрудничества клиента и поставщика услуг зависит от четкого понимания одного и ожиданий другого. Вот почему на рынке B2B принято заключать контракт. Однако сложные технические услуги, такие как аренда облачных ресурсов, трудно описать стандартным контрактом. Поэтому подписывают еще один документ ― соглашение об уровне обслуживания.
Что такое SLA
Соглашение об уровне обслуживания ― это документ, который определяет ожидаемый клиентом уровень обслуживания. Оно устанавливает показатели, по которым оцениваются услуги, а также правовую защиту или штрафы, если согласованный уровень не достигнут.
Термин появился благодаря ITIL ― методологии управления, настройки и постоянного улучшения бизнес-процессов в IT. Его используют компании со всего мира.
Каждая компания, которая принимает решение разместить свои критически важные сервисы в виртуальной инфраструктуре, должна понимать, насколько она отказоустойчива, потому что этого зависит работа бизнеса.
Соглашение подробно описывает обязательства сторон и качество обслуживания. У клиента не должно быть вопросов о том, какие услуги предоставит ему поставщик и каким образом.
Разница между SLA и OLA
Operational Level Agreement (OLA) ― это документ, который описывает работу отделов или подразделений в рамках одной компании. Например, в нем указывают как служба технической поддержки должна реагировать на инциденты и запросы, какие протоколы должны использоваться для запуска и работы критически важных приложений и т.д. А сла описывает сотрудничество с внешней компанией.
Чтобы обеспечить непрерывный процесс обслуживания, поставщик должен иметь оба документа.
Основные составляющие соглашения об уровне предоставления услуг
Не существует единого стандарта, определяющего все, что должно быть включено в каждый договор. Детали будут отличаться в зависимости от отрасли, типа продуктов, определенных индивидуальных договоренностей. Соглашение об обслуживании у облачного оператора должно включать:
- Список и описание услуг, предоставляемых провайдером.
- Объем и время их выполнения.
- Зоны ответственности поставщика и заказчика.
- Техническая поддержка.
- Требования к отчетности и метрики оценки качества услуг.
- Их стоимость, штрафные санкции и условия оплаты.
Если говорить о качестве сервиса, важно включить три основных параметра.
Доступность
Это ожидаемое время работоспособности инфраструктуры без учета плановых технических работ или простоев. Это время обычно представлено в диапазоне от 99% до 99,999%. Знаки после запятой могут показаться просто маркетинговым крючком, однако это не так.
В месяце примерно 730 часов. Когда облачный поставщик предлагает сла 99,95%, это означает, что его инфраструктура будет доступна в течение 729 часов, 38 минут и 6 секунд. То есть возможный допустимый простой составит 21 минуту, 54 секунды.
GigaCloud предоставляет SLA 99,95% на публичное облако на платформе VMware. Оно построено на базе четырех географически разнесенных дата-центров в Украине и ЕС. Это позволяет строить полностью зарезервированные решения и избежать единой точки отказа.
Время реакции на инцидент
Этот параметр означает, сколько времени пройдет с момента поступления сообщения об ошибке или с момента сигнала от системы мониторинга до начала работ по восстановлению нормального функционирования услуги.
Время разрешения инцидента
Это максимальное время с момента получения запроса службой технической поддержки провайдера и в течение которого специалисты обязаны выполнить работы.
Почему не 100%
Обеспечить 100% доступность невозможно по нескольким причинам.
Во-первых, сла облачного оператора не может быть выше значения, которое гарантирует дата-центр, в котором он размещает свое оборудование. Надежность дата-центров определяется по категории Tier:
- Tier I ― около 99,67%;
- Tier II ― 99,74%;
- Tier III ― 99,98%;
- Tier IV ― 99,99%.
Во-вторых, сбой может возникнуть на программном уровне, на который провайдер не влияет, поскольку это ответственность заказчика.
Например, если клиентское приложение имеет доступность 99,5%, инфраструктура, в которой оно развернуто ― 99,95%, а ЦОД, в котором «живет» облако ― 99,98%, то совокупная доступность составит не более 99,5%. Защищенный географически распределенный кластер не спасет постоянно «падающее» приложение.
В-третьих, чем больше девяток после запятой, тем дороже обойдется аренда виртуальной площадки. И не все IT-сервисы нуждаются в столь защищенном и отказоустойчивом кластере.
Что будет в случае невыполнения заявленного уровня
Соблюдение SLA ― юридическая обязанность оператора, и если обещанный уровень обслуживания не предоставляется, за это должны быть предусмотрены соответствующие последствия. Возмещение простоя производится в виде вычета суммы компенсации из стоимости услуг за следующий месяц.
Преимущества Service Level Agreement для обеих сторон
Наличие договора имеет свои достоинства как для оператора, так и для заказчика.
Преимущества для клиента:
- Услуга предоставляется на требуемом уровне.
- Четкое понимание, за что нужно платить.
- Возможность контролировать время выполнения заявок.
- Отсутствие финансового ущерба в случае инцидентов.
Преимущества для провайдера:
- Четко прописаны детали предоставления услуги и рассчитано время на плановые работы и устранение ошибок.
- Налажен процесс взаимодействия с клиентом.
- Определение уровня ответственности и критически важных параметров предоставления услуги.
- Возможность классифицировать какие-либо задачи обслуживания сервера.
Service Level Agreement дает заказчику уверенность в требуемом уровне сервиса. Однако прописанные в документе показатели ниже тех, к которым реально стремятся провайдеры. Указывая минимальное значение доступности, они работают над тем, чтобы увеличить его до максимального.
Раньше мы рассказывали зачем бизнесу облако, и какие четыре самые популярные задачи оно помогает решить.