Ответ не так очевиден, как кажется на первый взгляд.
1. Технологии: видимая точка отказа
Чаще всего инцидент начинается с технологического сбоя: падает сервер, не обновляется система, выходит из строя оборудование, срабатывает уязвимость. Технологии удобны тем, что их поломка хорошо измерима и заметна — есть логи, метрики, ошибки, алерты.
Однако в большинстве случаев технологии не «ломаются сами по себе».
Причины обычно кроются глубже:
● неверная конфигурация,
● отсутствие обновлений,
● слабая архитектура,
● игнорирование рисков,
● экономия на резервировании.
Технология — это инструмент. Она лишь проявляет проблему, но редко является ее первоисточником.
2. Процессы: скрытая хрупкость
Процессы ломаются тише, но именно они часто становятся катализатором инцидента.
Типичные признаки процессных сбоев:
● инструкции есть, но им не следуют;
● ответственность размыта;
● нет регламентов реагирования;
● решения принимаются слишком долго;
● процессы устарели, но формально «работают».
Во время инцидента выясняется, что:
● никто не знает, кто отвечает за решение;
● эскалация не определена;
● резервные сценарии существуют только на бумаге.
Процессы могут не выдержать стресс-теста реальностью, особенно если они создавались «для галочки», а не для реальной работы.
3. Люди: первый и последний рубеж
Хотя принято винить технологии, первыми часто ломаются люди:
● под давлением,
● в условиях неопределенности,
● при дефиците времени и информации.
Человеческий фактор проявляется в:
● панике или ступоре,
● ошибочных решениях,
● замалчивании проблемы,
● страхе ответственности,
● перегрузке и выгорании.
Но парадокс в том, что люди — не только слабое звено, но и главный источник устойчивости.
Даже при отказе технологий и процессов именно компетентные, подготовленные сотрудники способны:
● локализовать ущерб,
● принять нестандартное решение,
● восстановить управление ситуацией.
4. Взаимосвязь: цепная реакция
На практике инцидент развивается как цепочка:
1. Человек допускает ошибку или игнорирует риск.
2. Процесс не перехватывает ошибку.
3. Технология выходит из строя — и это становится заметно.
Или наоборот:
1. Технология дает сбой.
2. Процессы не справляются с масштабом.
3. Люди оказываются не готовы к кризису.
Редко ломается что-то одно — чаще рушится вся система целиком.
Вместо вывод
Первым при инциденте чаще всего ломаются не технологии, а люди и процессы.
Технологии лишь фиксируют результат накопленных управленческих, организационных и человеческих проблем.
Устойчивость организации определяется не отсутствием сбоев, а:
● зрелыми процессами,
● обученными людьми,
● культурой ответственности,
● готовностью к ошибкам и быстрому реагированию.
Инциденты неизбежны.
Катастрофы — нет, если система построена так, чтобы выдерживать удары, а не делать вид, что их не существует.
Наши каналы