Каждая секунда, когда вы не можете получить доступ к важным системам, может привести к потере доходов, снижению доверия клиентов и рискам кибербезопасности.
Достижение безотказной работы облачной платформы на уровне 99,995% – это не просто постановка амбициозных целей. Это требует архитектурных решений и операционных методов, которые делают такую надежность возможной.
Поскольку в Delinea знают, как важно время безотказной работы для клиентов, была разработана платформа Delinea, чтобы отвечать этим требованиям. В Delinea считают, что настоящее облачное приложение глобального масштаба должно быть пуленепробиваемым для критически важных рабочих нагрузок.
Что поставлено на карту?
Для руководителей служб безопасности высокая доступность означает меньше забот: ваши критически важные средства контроля безопасности идентификации продолжают работать даже во время киберкризиса или пиковых нагрузок, сокращая окна риска. ИТ-специалисты не будут получать вызовы в полночь из-за сбоев в работе системы, что позволит им сосредоточиться на стратегических проектах, а не на возобновлении работы. Для ИТ-директоров и других заинтересованных сторон бизнеса стабильное время безотказной работы помогает гарантировать, что ваши услуги, приносящие доход, и производительность пользователей не будут прерваны из-за простой платформы.
Кратковременный сбой в работе может привести к значительным финансовым потерям и репутационным убыткам.
Даже непродолжительный сбой в работе может привести к значительным финансовым потерям и репутационным убыткам. Если ваши клиенты не могут рассчитывать на ваши онлайн-сервисы, они могут обратиться к другим компаниям. Если ваши сотрудники или партнеры расстроятся в доступности критически важных систем, они могут использовать свои навыки в другом месте, лишив вас возможности эффективно вести бизнес.
Громкие сбои в работе сервисов за последние годы подчеркивают критическую важность надежных обязательств по бесперебойной работе ИТ-инфраструктуры. Например, в начале 2025 года крупный облачный центр обработки данных потерпел значительные сбои из-за ошибки конфигурации сети в одной из зон. Этот инцидент повлиял на многие предприятия, приведя к перебоям в работе и финансовым потерям.
Важно отметить, что не все простои возникают из-за сбоев в работе инфраструктуры. Сбои на уровне идентификации и доступа могут быть не менее разрушительными.
К примеру, компания Tesla столкнулась с инсайдерской угрозой, когда недовольный работник использовал привилегированный доступ для внесения несанкционированных изменений в производственные системы компании. Результатом стали задержки, операционный хаос и финансовые потери.
Кроме того, сингапурская компания SingHealth потерпела утечку персональных данных 1,5 миллиона пациентов. Расследование указало на задержку с исправлениями и слабый контроль доступа как на факторы, способствовавшие этому. Эти события подчеркивают риск недостаточного надзора за привилегированным доступом, особенно когда уязвимы чувствительные системы.
Учитывая конфиденциальный характер услуг идентификации и доступа, соглашения об уровне обслуживания (SLA) по времени безотказной работы являются критически важными.
Остальные поставщики в этой сфере предлагают 99,95% или 99,99% времени безотказной работы, но это не обязательно договорные SLA. Даже если это договорные соглашения, многие поставщики исключают плановое техническое обслуживание или плановые простои обновления или неправильных конфигураций на стороне клиента. На практике ваш сервис может быть офлайн более 170 минут в год и все равно считаться работающим «в пределах SLA».
В Delinea полагают, что этого недостаточно.
Delinea устанавливает новенькую планку сохранности облачных идентификационных данных. Компания стремится достичь и поддерживать 99,995% безотказной работы платформы Delinea, что эквивалентно ~26 минутам допустимого простоя в год. Этот SLA включает такие ситуации, как перебои в работе облачного провайдера, и такие действия, как обновления и исправления, которые происходят в Delinea без планового обслуживания. Это почти на уровне самых высоких стандартов для центров обработки данных Tier IV (полностью отказоустойчивые системы).
Даже небольшое увеличение процентов SLA резко уменьшает допустимое время простоя

Как Delinea достигает 99,995% безотказной работы платформы Delinea?
Delinea достигает такого уровня надежности и надежного обслуживания благодаря сочетанию передовых архитектурных решений, стратегий активного обслуживания и непрерывного мониторинга.
Delinea является одним из лидеров в предоставлении решений для управление привилегированным доступом (PAM) в облаке с 2015 года, когда она представила первое в области хранилище для предоставления услуг привилегированного доступа на основе SaaS. Более чем десятилетний опыт разработки и эксплуатации SaaS позволяет Delinea развивать и совершенствовать свои практики проектирования и управления. Как результат, клиенты Delinea могут полагаться на безопасные и надежные услуги по защите идентификационных данных, с которыми немногие конкуренты могут сравниться.
Создано для отказоустойчивости благодаря контейнерной архитектуре микросервисов
Архитектурные решения Delinea обеспечивают чрезвычайную надежность. Платформа Delinea построена с использованием контейнерной, распределенной архитектуры микросервисов (например, резервные серверы, несколько центров обработки данных, автоматический обход отказов), что означает отсутствие единой точки отказа. Если один компонент или сайт выходит из строя, другие мгновенно подключаются, чтобы продолжить работу сервисов.
Чтобы рассчитать сквозную SLA Delinea, объединяем значение времени безотказной работы всех компонентов платформы Delinea.
Для достижения этих обязательств Delinea разработала платформу безопасности идентификации, используя несколько лучших в своем классе подходов, в частности:
Контейнерные микросервисы
Благодаря микросервисам неисправности в одном сервисе (например, неисправность в механизме отчетности или коллекторе журналов аудита) не распространяются каскадом по всей платформе Delinea.
В сочетании с оркестровкой контейнеров такая изоляция приводит к повышению доступности и улучшению времени безотказной работы, что критически важно для инструментов безопасности идентификационных данных, которые должны работать 24/7 с минимальными перерывами в обслуживании.
Кроме того, контейнерные сервисы масштабируются горизонтально. При резком росте нагрузки, например, когда вам нужно подключить сотни пользователей, синхронизировать права из облачных каталогов или запустить массовые записи сеансов, платформа может масштабировать соответствующие сервисы, не влияя на другие. Это обеспечивает стабильную производительность даже под нагрузкой.
Контейнеры неизменны и эфемерны по своей сути. Это хорошо согласуется с принципами нулевого доверия: платформа может самовосстанавливаться, ротировать сервисы и избегать устойчивых, долговременных поверхностей атак. Delinea также может применять гранулированную RBAC и сегментацию сети на уровне сервисов, уменьшая риски бокового перемещения в пределах самой платформы. Архитектура, которая обеспечивает более быструю доставку функций и инноваций, позволяет решать проблемы безопасности за часы, а не недели или месяцы.
Архитектура Delinea предпочитает клиентов, которые развертывают рабочие нагрузки в Kubernetes, используют конвейеры DevOps или создают внутренние инструменты с помощью API. Ее сервисы являются модульными и доступны через хорошо задокументированные API, что облегчает подключение средств контроля безопасности идентификационных данных непосредственно к CI/CD, облачным средам и системам автоматизации.
Конфигурация active-active
Благодаря конфигурации active-active платформа Delinea поддерживает несколько экземпляров своих сервисов, работающих одновременно в разных местах. Эта конфигурация поддерживает немедленное обходное решение; если один экземпляр сталкивается с проблемой, другие беспрепятственно перенимают ее, поддерживая непрерывную доступность сервиса. Такое резервирование имеет решающее значение для предотвращения сбоев, которые могут повлиять на пользователей и операции.
Георепликация
Георепликация еще больше повышает эту отказоустойчивость, распределяя данные между несколькими географическими регионами. Следует отметить, что поставщики услуг не могут обоснованно предлагать более 99,95% безотказной работы, если они явно не спроектировали свою услугу для поддержки нескольких регионов.
Такой подход защищает от региональных перебоев и приближает данные к пользователям, уменьшая задержки и улучшая скорость доступа. К примеру, развертывание платформы Delinea охватывает семь географических регионов, с несколькими регионами и кластерами в каждом регионе. Такое широкое распределение позволяет системе перенаправлять трафик в другой рабочий регион, даже если целый регион сталкивается с непредсказуемым событием, тем самым поддерживая строгие требования SLA по времени безотказной работы.
Обновление и обслуживание без простоев
В такой области, как быстро развивающаяся кибербезопасность, обновления системы происходят часто, чтобы включить новые функции и возможности, устранить уязвимости и повысить производительность системы.
Однако развертывание обновлений может быть рискованно для непрерывности обслуживания. Если вам придется выводить системы PAM в офлайн для выполнения обновлений, ваши сотрудники не смогут получить доступ к нужным им системам, у служебных аккаунтов могут возникнуть проблемы с аутентификацией или интеграция может нарушиться.
Чтобы решить эту проблему, необходимы сложные развёртывающие конвейеры, которые способствуют обновлению без простоев, обеспечивая работу клиентов без перерывов в обслуживании во время процесса обновления.
Микросервисы позволяют командам разработчиков Delinea Platform развертывать обновление независимо в разных частях Delinea Platform. Критически важные новые функции – такие как обновленные средства контроля политик, оценка рисков или интеграции – можно внедрять в производство, не дожидаясь массовых обновлений версий.
Методология выпуска релизов Delinea включает в себя canary релизы с возможностью отката. При таком подходе новые обновления сначала разворачиваются для небольшой подгруппы микросервисов или пользователей, что позволяет команде Delinea Operations контролировать производительность и стабильность изменений в контролируемой среде, прежде чем выпустить их для клиентов. В случае обнаружения каких-либо проблем система может быстро откатиться к предыдущей стабильной версии, смягчая потенциальное влияние.
Такая осторожная стратегия развертывания позволяет Delinea внедрять непрерывные микрорелизы и обновления на системном уровне для платформы Delinea без прерывания работы или обращения за профессиональной поддержкой.
Проактивное управление системой с помощью мониторинга, наблюдения и реагирования
Достижение высокой доступности также включает в себя непрерывный мониторинг системы и быстрое реагирование на инциденты.
Delinea использует передовые инструменты наблюдения, которые предоставляют информацию о производительности и состоянии системы в режиме реального времени. Эти инструменты непрерывно оценивают и отслеживают самые популярные сценарии использования, чтобы выявить аномалии или потенциальные проблемы, прежде чем они перерастут в серьезные проблемы.
Ключевые элементы проактивного подхода Delinea к управлению системой для платформы Delinea включают:
- Мониторинг состояния системы в режиме реального времени для ключевых конечных точек обслуживания, рабочих нагрузок и инфраструктуры.
- Наблюдаемость на основе конкретных случаев, непрерывная оценка основных рабочих процессов для выявления аномалий.
- Автоматическое оповещение с пороговыми значениями, настроенными для раннего обнаружения регресса производительности и шаблонов сбоев.
- Анализ первопричин и циклы обратной связи для уменьшения повторяемости и оптимизации надежности платформы.
Каждый клиент имеет выделенного, логически изолированного арендатора. Delinea контролирует каждого арендатора отдельно, что позволяет отчитываться о показателях безотказной работы для каждого арендатора.
Специальная команда Delinea Site Reliability Engineering (SRE) дополняет эти технологии. Их миссия состоит в том, чтобы сократить среднее время выявления и устранения проблем. Они работают круглосуточно, чтобы контролировать производительность системы и проактивно решать любые возникающие проблемы до того, как они повлекут за собой проблемы для клиентов.
Сравните архитектуру платформы Delinea с традиционными SaaS

Microsoft Azure способствует высокой доступности Delinea

До сих пор мы обсуждали, как архитектура и возможности, встроенные непосредственно в платформу Delinea и используемые для ее поддержки, поддерживают обязательство по высокому времени безотказной работы.
Кроме того, клиенты платформы Delinea также получают выгоду от стратегического использования облачной платформы Microsoft Azure для размещения программного обеспечения и связанных с ним компонентов.
Delinea использует несколько важных возможностей, которые предоставляет Azure, чтобы повысить отказоустойчивость и доступность платформы Delinea – концепции, не используемые многими веб-приложениями.
Зона доступности и резервирования
Это физически отделенные локации в регионе Azure, каждый из которых имеет один или несколько центров обработки данных, оборудованных независимым питанием, охлаждением и сетью. Развертывая сервисы в нескольких зонах доступности, платформа Delinea может выдерживать сбои в работе центров обработки данных, повышать отказоустойчивость и поддерживать высокую доступность. Такое зональное развертывание поддерживает автоматический обход отказов и распределение нагрузки, что критически важно для поддержания безотказной работы.
Кроме того, каждый экземпляр Delinea Platform развернут в двух регионах Azure, оба из которых работают в активном/неактивном режиме.
Хранилище с географическим резервированием (GRS)
Для защиты от региональных сбоев платформа Delinea также использует Azure GRS, которая асинхронно реплицирует данные во вторичный регион в сотнях километров от основного местоположения. Такая георепликация позволяет сохранять данные доступными и невредимыми в случае региональных сбоев, что подтверждает нашу приверженность надежности и доступности данных.
Активная георепликация для баз данных
Azure обеспечивает активную георепликацию для служб баз данных, чтобы создавать читаемые вторичные базы данных в разных регионах. В случае выхода из строя основной базы данных, система может быстро переключиться на вторичную базу данных, минимизируя время простоя и обеспечивая непрерывную доступность сервисов.
Гибкость регионального хостинга
Благодаря глобальной инфраструктуре Azure, компания Delinea может быстро расширять возможности хостинга платформы Delinea на новые регионы. Это позволяет клиентам пользоваться надежным доступом к услугам с низкой задержкой, независимо от географического расположения. Возможность развертывать сервисы ближе к конечным пользователям не только помогает Delinea добиваться целей безотказной работы, но повышает производительность системы и обеспечивает бесперебойную работу пользователей.
Не все требования к безотказности одинаковы
Хотя многие поставщики средств безопасности идентификации и доступа рекламируют высокую доступность, очень важно изучать мелкий шрифт.
Вопросы, которые следует задать любому поставщику по его обязательствам по безотказной работе
1. Включено ли время безотказной работы в ваш MSLA?
Delinea включает 99,995% времени безотказной работы для платформы Delinea в MSLA. Остальные поставщики этого не делают.
2. Каков у вас опыт безотказной работы?
Не все поставщики публикуют данные о времени безотказной работы. Delinea считает, что прозрачность способствует подотчетности и стремлению к совершенству.
В 2024 году Delinea выполнила все обновления и исправления для платформы Delinea без плановых простоев, обновила 28 глобальных кластеров Kubernetes в течение одного часа после обнаружения критической уязвимости и развертывала обновление безопасности почти каждый день – и все это без прерывания доступа клиентов.
3. Какие сценарии исключаются из SLA?
Delinea несет ответственность за платформу Delinea, даже если основная облачная инфраструктура выходит из строя. Кроме того, Delinea не планирует запланированные простои для обновления платформы Delinea, в отличие от других поставщиков, регулярно планирующих простои для выполнения обновлений.
4. Как вы изолируете арендаторов?
Платформа Delinea предлагает изоляцию каждого арендатора с помощью индивидуальных ключей шифрования, метрика безотказной работы и наблюдательности на уровне арендатора.
5. Какие требования к планированию технического обслуживания у вас есть?
В отличие от других поставщиков, часто выталкивающих обновления в окна технического обслуживания, контролируемые производителем, Delinea не имеет требований к переносу сроков технического обслуживания для платформы Delinea.
6. Как вы создаете резервные копии хранилища PAM для отказоустойчивости?
Delinea – единственный поставщик PAM SaaS, предлагающий резервное копирование хранилища почти в режиме реального времени для инфраструктуры клиента, то, что Delinea называют «Resilient Secrets».
7. Какие модели компенсации простоев вы используете?
Некоторые поставщики предлагают минимальные кредиты, например, только 10% кредита за 88 часов простоя в год, не считая широких категорий сбоев, и часто не предоставляют кредиты на договорное обслуживание, привязанные к их SLA. Delinea поддерживает приверженность бесперебойной работе с помощью контрактных сервисных кредитов, определенных в MSLA. Спросите поставщика PAM о его обязательствах по MSLA.
Архитектура платформы, надежность и прозрачность имеют значение
Прежде чем подписывать соглашение с любым поставщиком, тщательно изучите заявления о времени безотказной работы, а также реальные последствия и послужной список, стоящих за этими заявлениями.
Обязательство Delinea по безотказной работе на уровне 99,995% SLA для платформы Delinea поддерживается стратегией, включающей устойчивый архитектурный дизайн, бесперебойные процессы обновления, проактивное управление системой и десятилетний опыт эксплуатации.
Благодаря внедрению конфигураций active-active, георепликации, конвейеров обновления с нулевым временем простому и непрерывному мониторингу с помощью специальной команды SRE, Delinea уверена в способности выполнить свои обязательства по безотказной работе.
Источник: Engineering the Delinea SaaS platform for near-perfect uptime
