Незапланированные простои – это событие, которого каждый бизнес старается избежать, но с которым ему приходится сталкиваться. В современном мире цифровых технологий перебои в работе могут быть особенно опасны, особенно если предприятие не готово к ним. Перебои не только вызывают недовольство сотрудников и гнев клиентов, что приводит к многочисленным нематериальным издержкам, например снижению удовлетворенности и ухудшению репутации компании, но также к снижению производительности труда сотрудников в результате незапланированных простоев, что может существенно повлиять на итоговый результат. При таких высоких ставках неудивительно, что все – от технического директора до специалистов службы технической поддержки – уделяют большое внимание устранению основных причин простоев.
К сожалению, многие смотрят в неправильном направлении или не рассматривают решения, созданные для полного учета реальной стоимости простоя за счет минимизации рисков простоя. Поскольку все сосредоточены на больших цифрах разовых простоев, из виду упускается истинный виновник издержек, связанных с простоями, – множество мелких сбоев, происходящих прямо у всех на виду.
Как микропростои снижают эффективность работы
В новостях нередко появляются сообщения об ошеломляющих затратах на простои – крупные сбои в работе компаний Amazon, Facebook и Apple постоянно попадают в заголовки. Хотя эти цифры имеют большое значение, они часто не дают полного представления об истинной стоимости простоя. Чтобы рассчитать эти затраты, необходимо глубже изучить более мелкие отключения и перебои в работе, которые в большинстве случаев остаются незамеченными и о которых не сообщается в организации.
Возможно, вы уже сталкивались с такими микропростоями или микроаутами, как загрузка бизнес-портала, не загружающийся из облака файл или, что еще хуже, сбой, уничтоживший несколько часов работы и приведший к значительной потере данных. Хотя такие «карманные» простои ИТ-системы могут приводить к сбоям в работе и снижению производительности, о них часто не сообщают в ИТ-службу из-за отсутствия хлопот. Однако их количество и частота возникновения могут усугубить ситуацию и ежегодно обходиться компаниям в миллионы недополученных доходов.
И я не преувеличиваю. По данным SolarWinds, средняя стоимость минуты простоя для малых предприятий составляет 427 долларов, а для крупных предприятий – 9000 долларов. Если рассматривать стоимость минуты в почасовом исчислении, то один час простоя обходится малым предприятиям примерно в $25 620, а крупным – более чем в полмиллиона ($540 000). Или, скажем, один сотрудник ежедневно простаивает более 5 минут, умножьте это на всю компанию с потенциальными тысячами сотрудников, и общая потеря дохода будет достаточной, чтобы у любого человека затряслись коленки.
Итог: Хотя нельзя игнорировать затраты на незапланированные простои – упущенные продажи, испорченную репутацию и снижение удовлетворенности клиентов, – не стоит пренебрегать и затратами на микропростоях, вызванных незарегистрированной неэффективностью или сбоями в работе ИТ-системы в рамках всех бизнес-операций. Отмахнуться от них – значит пустить на ветер миллионные прибыли и потенциальную производительность.
3 шага по устранению микропростоев и минимизации затрат на перерывы в работе
Предприятиям, стремящимся к процветанию, необходимо учитывать риски, связанные с простоем ИТ, как на макро-, так и на микроуровне. И в том, и в другом случае остаются обычные лучшие практики – резервное копирование и восстановление, обновления и постоянное тестирование. Однако для эффективного решения непрозрачной и объемной проблемы микропростоя ИТ-команды должны предпринять ряд дополнительных мер:
1. Проведите опросы и получите обратную связь. Опросите всю организацию, чтобы определить, насколько частыми или масштабными могут быть эти микропростои. Простые вопросы типа «Как часто вы сталкиваетесь с простоем в течение дня? Можно ли было избежать простоя с помощью ИТ-поддержки?» позволяют получить данные, необходимые для правильной количественной оценки проблемы, а также понять закономерности возникновения сбоев, о которых ИТ-служба может не знать.
Это один из примеров того, как сбор и приоритизация мнений и отзывов в организации может иметь решающее значение, особенно для групп ИТ-поддержки. Если сотрудники видят, что их мнение и обратная связь не являются приоритетными, они могут почувствовать себя недооцененными и невовлеченными, что приведет к увеличению текучести кадров и последующим издержкам для общей культуры компании.
Благодаря регулярному проведению опросов и приоритетному учету мнений и отзывов сотрудников организации, они могут легче выражать свои мысли, опасения и предложения, что позволяет им чувствовать себя услышанными, оцененными по достоинству и способствует формированию более инклюзивной культуры сотрудничества.
2. Вести учет и создавать базовые показатели
Как говорится, что измеряется, то и делается. Начните строить базовые KPI для микропростоя, используя данные, полученные от респондентов опроса или от вашего инструмента наблюдения (подробнее об этом ниже). Затем установите четкие цели, чуть более чем полностью достижимые: если 25% сотрудников предпочитают не сообщать о простоях в ИТ-службу, стремитесь снизить этот показатель в течение трех-шести месяцев.
Данные опроса также могут помочь в разработке значимых соглашений об уровне обслуживания (SLA), направленных на повышение времени безотказной работы. Например, если более 40% сотрудников сталкивались с перебоями в работе, обязуйтесь снизить этот показатель до 15% к определенному сроку.
Если все это увязать в план по снижению частоты и затрат на восстановление после простоев, то ИТ-команды получат рычаги влияния, необходимые для получения поддержки со стороны высшего руководства, и бюджет, необходимый для инвестиций в лучшие инструменты, услуги или решения.
3.Консолидация инструментов и поставщиков, где это возможно
Консолидация огромного количества инструментов и решений поставщиков позволяет снизить затраты на простои не только с одной стороны. Во-первых, для различных ИТ-подразделений зачастую экономически выгоднее и удобнее работать с общим решением, а не с разрозненными инструментами.
Во-вторых, пользователи могут быть более склонны сообщать о сбоях и простоях, если им не нужно входить в несколько служб или использовать различные пользовательские интерфейсы для выполнения работы. Трудности с навигацией между системами затрудняют отслеживание хода выполнения запросов, что приводит к разочарованию и задержкам в решении проблем.
Попытка эскалации между несколькими системами, используемыми для управления предоставлением услуг, также может создать значительные проблемы для команд, отвечающих за предоставление услуг. Эскалация запросов между системами может отнимать много времени и приводить к ошибкам, затрудняя своевременное и удовлетворительное решение проблемы. Отсутствие интеграции и согласованности между системами в конечном итоге может нарушить рабочий процесс, снизить производительность и негативно повлиять на общее качество обслуживания клиентов.
Как унифицированная наблюдаемость может помочь ИТ-командам бороться с простоями
Это лишь некоторые из множества стратегий, которые могут быть использованы компаниями для борьбы с микропростоями до того, как они разрастутся и нанесут значительный репутационный ущерб. Создавая в компании культуру обратной связи для упреждения потенциальных проблем и заблаговременного обнаружения, анализа и устранения этих небольших очагов простоя, ИТ-команды лучше оснащены, находятся в лучшем психологическом состоянии и более подготовлены к тому, что крупные сбои и более дорогостоящие простои неизбежно возникнут.
В борьбе с высокими затратами на простои и стремлением к достижению 100% доступности такие решения, SolarWinds Observability, дают командам преимущество за счет централизации мониторинга и аналитики из разных сред на одной панели. Используя этот ресурс, команды могут легче выявлять и устранять проблемы, вызывающие простои серверов, сетей и других объектов критически важной инфраструктуры, чтобы поддерживать оптимальную работу бизнес-услуг. Кроме того, использование решения для обеспечения наблюдаемости, построенного на основе бесшовной интеграции с комплексным решением ITSM, может помочь организациям более эффективно устранять и минимизировать потери производительности сотрудников в режиме реального времени за счет автоматического создания инцидентов на основе оповещений.
Источник: Micro-Outages Uncovered: Exploring the Real Cost of Downtime for Your Business