Sobes Expert - База вопросов технических собеседований

Что такое CloudTrail (или аналог в других облаках) и зачем он нужен?

CloudTrail — это сервис аудита действий в облаке (в AWS) — журнал, который фиксирует все API-вызовы и события, происходящие в аккаунте: операции консоли, CLI, SDK, действия от сервисов. Аналогичные функции в других облаках: в GCP — Cloud Audit Logs (Admin Activity, Data Access, System Events), в Azure — Activity Log + Diagnostic/Resource logs.

Что именно фиксируется

Management events — создание/изменение/удаление ресурсов и управления ими (создание IAM-пользователя, изменение политик, создание EC2, изменение security group и т. п.).
Data events — операции с данными на уровне объектов/ресурсов (например, S3:GetObject, S3:PutObject, вызовы Lambda функций). Они высоко деталируются и генерируют большой объём логов.
Read vs Write — различие по типу операций (чтение/запись).
System events — события, генерируемые платформой (в некоторых облаках).

Ключевые возможности CloudTrail (и эквивалентов)

централизованный сбор событий (включая cross-account/организационные трейлы);
длительное хранение в S3 (или другом хранилище) и поддержка lifecycle;
интеграция с CloudWatch / EventBridge для построения алертов и автоматических реакций;
логическая/физическая проверка целостности записей (log file integrity);
поддержка поиска/запросов (CloudTrail Lake / аналоги) для forensic-анализа;
опция включения Data Events для детального трекинга операций с объектами.

Практические сценарии использования

расследование инцидентов: воспроизведение пошаговой хронологии изменений (кто, когда, откуда, какие API-вызовы);
обнаружение несанкционированного доступа: создание новых ключей, подозрительные ConsoleLogin/AssumeRole;
контроль соответствия и аудит (compliance) — отчёты о модификациях критичных ресурсов;
тревоги и автоматизация: триггер на изменение IAM-политики → уведомление/авто-откат;
анализ действий приложений и оптимизация операций с данными.

Лучшие практики по настройке и эксплуатации

включить multi-region и organization trail (если есть организация) — чтобы ловить события во всех регионах и аккаунтах централизованно;
хранить логи в отдельном, защищённом аккаунте/бакете с ограниченным доступом; включить шифрование (KMS) и log file validation;
включать data events выборочно (S3, Lambda) — там большой объём, поэтому выбирать только критичные ресурсы;
настроить интеграцию с SIEM / SIEM-пайплайном (Elastic, Splunk, Chronicle и т. п.) для кореляции и долгосрочного анализа;
строить алерты через EventBridge/CloudWatch → SNS/PagerDuty для критичных операций (создание/удаление ролей, массовые GetObject и т.д.);
применять lifecycle-политику и хранить «сырые» логи достаточно долго для соответствия требованиям;
ревью и мониторинг anomalous patterns (частые отказанные запросы, внезапные spikes в API-calls) — использовать встроенные Insights/ML-фичи при наличии.

Ограничения и нюансы

высокодетальные data events генерируют много данных и могут быть дорогими/шумными — включайте аккуратно;
система даёт запись вызова API, но не всегда даёт полную картину уровня приложения (нужны дополнения: APM, логи приложений, сетевые логи).

Как использовать в расследовании — краткий пример

По алерту на изменение IAM смотрим соответствующий CloudTrail event: eventTime, userIdentity, eventName, sourceIPAddress, userAgent, requestParameters.
Проверяем связанные события (assume-role, console login) и timeline в соседних аккаунтах/регионах.
Поиск по data events (например, массовые GetObject) для выявления возможного exfiltration.
Экспорт результатов в SIEM и запуск playbook (revoke keys, disable role, rotate KMS).

Использование CloudTrail (или аналогов) — базовый элемент безопасности, операционного контроля и соответствия в облаке: он даёт фактическую, неизменяемую хронику того, что происходило в инфраструктуре, и нужен для обнаружения, расследования и реагирования на инциденты.

14-08-2025

Medium 109 просмотров