Процесс реагирования на инцидент

Когда сработала сигнализация, важна не паника, а заранее отрепетированный порядок действий — иначе в спешке погибнут именно те следы, ради которых всё затевалось.

Реагирование на инцидент (Incident Response, IR) — управляемый процесс обнаружения, локализации и устранения последствий компьютерного инцидента, в котором каждое действие документируется, а доказательства сохраняются в неизменном виде.

Этот урок — про дисциплину, а не про геройство. Реагирование на инцидент мы рассматриваем с позиции защитника: как организовать работу так, чтобы остановить атаку и одновременно сохранить доказательства для последующего разбора и, если понадобится, суда. Криминалист (forensic analyst) здесь — не одиночка с фонариком, а участник команды, у которого узкая, но критичная роль: грамотно собрать и зафиксировать данные, не разрушив их. Несанкционированный доступ к чужим системам и нарушение их работы наказуемы (ст. 272, 274 УК РФ); всё, что описано ниже, относится к реагированию на инциденты в своей инфраструктуре или там, где у команды есть на это полномочия.

Зачем это знать защитнику

Инцидент — это всегда дефицит времени и информации одновременно. Атакующий уже внутри, телеметрии не хватает, а каждое неосторожное действие администратора (перезагрузка, переустановка, «давайте просто почистим») безвозвратно стирает улики. Структурированный процесс IR решает обе задачи разом: он даёт команде понятную последовательность шагов, чтобы быстро остановить ущерб, и встроенные правила сохранения данных, чтобы не уничтожить то, что потом понадобится для расследования. Без процесса организация снова и снова наступает на одни грабли: тушит пожар, но не понимает его причину, а значит не может закрыть исходную брешь.

Шесть фаз жизненного цикла IR

Классическую модель удобно представлять как шесть последовательных, но циклических фаз. Их формулировки восходят к методологиям NIST SP 800-61 и SANS; названия могут отличаться, но суть одна.

1. Подготовка    (Preparation)      — до инцидента: люди, инструменты, регламенты
2. Обнаружение   (Detection)        — заметить и подтвердить инцидент
3. Сдерживание   (Containment)      — остановить распространение, не дать разрастись
4. Устранение    (Eradication)      — убрать причину: вредонос, учётки, бэкдоры
5. Восстановление(Recovery)         — вернуть системы в строй и убедиться, что чисто
6. Уроки         (Lessons Learned)  — разбор: что произошло и как не повторить
        |__________________________________________________________|
                 выводы фазы 6 улучшают подготовку (фаза 1)

Подготовка

Самая важная фаза — и единственная, что происходит до инцидента. Здесь команда готовит то, что в горячий момент создать уже некогда: план реагирования с ролями и контактами, «тревожный чемоданчик» аналитика (загрузочные носители, проверенные утилиты сбора, чистые диски для образов), настроенное логирование и резервные копии, договорённости о полномочиях. Хорошая подготовка превращает хаос в рутину.

Обнаружение

Инцидент нужно сначала заметить, а потом — подтвердить, что это действительно он, а не ложная тревога. Сигналы приходят от SIEM, EDR, антивируса, жалоб пользователей или внешних уведомлений. Задача фазы — оценить масштаб (что затронуто), классифицировать инцидент и зафиксировать точное время обнаружения. С этого момента включается режим сохранения доказательств.

Сдерживание

Цель — не дать инциденту разрастись, пока команда разбирается. Различают краткосрочное сдерживание (быстро изолировать заражённую машину от сети) и долгосрочное (временные обходные меры, пока готовится полноценное устранение). Ключевой момент для криминалиста: изолировать — не значит выключить. Об этом ниже.

Устранение

Удаляем причину: вредоносные файлы, созданные злоумышленником учётные записи, закреплённые задачи и бэкдоры, закрываем использованную уязвимость. Если этого не сделать аккуратно и полностью, атакующий вернётся тем же путём.

Восстановление

Возвращаем системы в работу: из доверенных резервных копий или переустановкой, с усиленным мониторингом первое время. Важно убедиться, что восстановленная система действительно чистая, а не несёт тот же бэкдор из заражённого бэкапа.

Уроки

Через несколько дней после закрытия — спокойный разбор без поиска виноватых: что произошло по таймлайну, что сработало, что нет, какие изменения внести. Выводы возвращаются в фазу подготовки, замыкая цикл.

Роль криминалиста и сохранение доказательств

Криминалист включается уже на обнаружении и работает плотнее всего на сдерживании. Его задача — собрать данные так, чтобы они остались пригодны как доказательства. Здесь действует порядок волатильности (order of volatility): сначала собирают то, что исчезнет быстрее всего.

Порядок волатильности — от самого «летучего» к стойкому:
  1. Регистры и кэш процессора        (миллисекунды)
  2. ОЗУ: процессы, сетевые соединения (до выключения питания)
  3. Состояние сети, ARP, таблицы      (секунды-минуты)
  4. Содержимое дисков                 (сохраняется)
  5. Архивы, бэкапы, бумажные носители (долговременно)

Отсюда — главное правило для «живой» системы: сначала снять дамп оперативной памяти, потом всё остальное. В ОЗУ живут ключи шифрования, расшифрованные данные, активные сетевые соединения и процессы вредоноса, которых нет на диске. Стоит выдернуть питание — и всё это исчезает навсегда. Поэтому необдуманная перезагрузка заражённой машины уничтожает половину улик.

Три принципа сохранения доказательств, которые криминалист соблюдает на каждом шаге:

  • Неизменность. С оригиналом не работают напрямую — снимают побитовую копию (образ) и хешируют её, чтобы доказать, что данные не менялись.
  • Цепочка хранения (chain of custody). Документируют, кто, когда и что делал с доказательством — непрерывный журнал от изъятия до анализа.
  • Документирование. Каждое действие фиксируется с точным временем: что выполнено, на какой системе, кем. Память подводит — записи нет.

Как это работает под капотом

Почему процесс именно такой, становится понятно, если посмотреть на конфликт двух целей. Команда восстановления хочет как можно быстрее вернуть сервис, а это давит в сторону «переустановить и забыть». Криминалист хочет сохранить состояние системы для анализа, а это требует сначала снять данные и только потом трогать. Структурированный IR разводит эти цели по фазам: сбор доказательств (часть обнаружения и сдерживания) идёт до устранения и восстановления. Поэтому в зрелых командах действует правило: прежде чем «чинить» скомпрометированную машину, с неё снимают образ памяти и диска. Технически это означает, что аналитик работает с подключённым блокиратором записи (write blocker) или с заведомо read-only копией, а все вычисления хешей (обычно SHA-256) фиксируются в протоколе — это и есть доказательство неизменности, на которое потом опирается весь разбор.

Как защититься

1. Готовьте план заранее. Документированный IR-план с ролями, контактами и порядком действий, отрепетированный на учениях, в десятки раз ценнее импровизации в момент атаки.

2. Изолируйте, а не выключайте. Заражённую машину отключают от сети (физически или через порт коммутатора), но не обесточивают и не перезагружают, пока не снят дамп ОЗУ. Выдернутое питание уничтожает летучие улики.

3. Соблюдайте порядок волатильности. Сначала память и сетевое состояние, потом диски. То, что исчезнет быстрее, собирают первым.

4. С оригиналом — только через копию. Анализируют образ, а не живой диск. Хеш фиксируют сразу, чтобы доказать неизменность.

5. Ведите цепочку хранения и журнал. Каждое прикосновение к доказательству и каждое действие — с временной меткой и ответственным. Без этого данные теряют доказательную силу.

6. Замыкайте цикл. Разбор «уроков» возвращается в подготовку: закрытая брешь и улучшенный мониторинг — это и есть результат инцидента, который окупает потраченное время.

Итоги

  • IR — это шесть фаз: подготовка, обнаружение, сдерживание, устранение, восстановление, уроки; цикл замыкается.
  • Самая важная фаза — подготовка: всё, что нельзя создать в момент атаки, готовят заранее.
  • Роль криминалиста — собрать и зафиксировать данные, не разрушив их; он работает плотнее всего на обнаружении и сдерживании.
  • Изолировать != выключать: сначала дамп ОЗУ по порядку волатильности, и только потом восстановление.
  • Доказательства держатся на трёх китах: неизменность, цепочка хранения, документирование; реагировать так можно только в своей инфраструктуре (ст. 272/274 УК РФ).
Проверьте себя
1. Команда обнаружила заражённый сервер. С точки зрения криминалиста, какое первое действие на «живой» машине правильное?
AСнять дамп оперативной памяти, и только потом отключать/выключать систему
BНемедленно перезагрузить сервер, чтобы сбросить вредоносные процессы
CСразу переустановить ОС из резервной копии для быстрого восстановления
DВыдернуть питание, чтобы мгновенно остановить распространение
2. Почему фазу «Подготовка» считают самой важной в жизненном цикле IR?
AЭто единственная фаза до инцидента: план, инструменты и логи нельзя создать в момент атаки
BВ ней происходит само удаление вредоноса из системы
CОна позволяет пропустить фазы сдерживания и устранения
DВ ней восстанавливают сервис из резервных копий