Sobes Expert - База вопросов технических собеседований

Что такое облачная масштабируемость?

Облачная масштабируемость — это способность системы автоматически или вручную увеличивать или уменьшать вычислительные ресурсы (вычисления, хранение, сеть) в ответ на изменение нагрузки так, чтобы сохранялись производительность, доступность и экономическая эффективность.

Ключевые понятия

Масштабирование (scaling): увеличение/уменьшение ресурсов.
Горизонтальное (scale-out/in): добавление или удаление экземпляров сервисов (серверов, контейнеров).
Вертикальное (scale-up/down): увеличение мощностей одного экземпляра (CPU, память, диск).
Эластичность (elasticity): быстрое автоматическое изменение ресурсов в ответ на кратковременные пики. Эластичность — практическая реализация масштабируемости в облаке.

Типы автоматики и политики

Ручное: администратор меняет конфигурацию. Подходит для предсказуемых изменений.
Реактивное (threshold-based): автоскейлер реагирует на метрики (CPU, RPS, latency, queue depth).
Целевое масштабирование (target tracking): система поддерживает метрику на заданном уровне (например, 60% CPU).
Шаговое (step): увеличивает/уменьшает количество по ступеням при превышении порогов.
Прогнозное/плановое: на основе исторических данных или расписания (например, праздничные кампании) — снижает риски холодного старта.

Архитектурные требования

Стейтлесс против стейтфул: стейтлесс-сервисы легко масштабируются горизонтально; stateful требует стратегий сохранения состояния (сессии в отдельном сторе, шардирование, sticky sessions).
Балансировка нагрузки: распределяет трафик между экземплярами, поддерживает health checks и failover.
Устойчивость данных: масштабирование вычислений без единой точки отказа в хранилище (репликация, шардинг, распределённые кэши).
Разделение обязанностей: выделение чтения/записи (CQRS), очереди для асинхронных задач.

Масштабирование хранилищ и баз данных

Репликация (read replicas) для распределения чтения.
Горизонтальное разделение (sharding) для больших наборов данных.
Кеширование (in-memory caches, CDN) для снижения нагрузки на БД и ускорения отклика.
Использование специализированных масштабируемых сервисов (объектное хранилище, распределённые базы).

Операционные аспекты и риски

Производственные лимиты: API/тарифные ограничения, IOPS, сеть.
Thrashing: слишком частое масштабирование в обе стороны — бороться cooldown’ами и hysteresis.
Стоимость: масштабирование увеличивает расходы; важно балансировать SLO и бюджет.
Холодный старт: новые экземпляры требуют времени на запуск и инициализацию; warm pools и контейнерные образы помогают.
Согласованность данных и задержки: распределённые системы часто выбирают eventual consistency ради доступности и масштабируемости.

Поведенческие паттерны устойчивости

Bulkhead (отделение ресурсов), circuit breaker, backpressure, очереди и rate limiting — помогают избежать каскадных сбоев при всплесках нагрузки.
Canary/blue-green деплой для безопасного расширения новых версий.

Мониторинг и метрики

Основные метрики: RPS, latency (p95/p99), error rate, CPU, memory, queue depth, saturation.
SLIs/SLOs и алерты — ключ к своевременному масштабированию и контролю затрат.
Трассировка запросов и логирование для обнаружения узких мест.

Особенности серверлесс и контейнеров

Серверлесс автоматически масштабирует до большого числа параллельных инстансов и может масштабироваться до нуля; важно учитывать ограничения одновременности и холодные старты.
Контейнерные оркестраторы (Kubernetes) предлагают гибкие стратегии автоскейлинга, включая HPA/VPA/Cluster Autoscaler.

Практический подход
Проектируйте приложения «масштабируемыми изначально»: разделяйте стейт, используйте асинхронную обработку, кэширование и метрики, задавайте разумные пороги и cooldown’ы, тестируйте автоскейлинг с нагрузочными сценариями.

14-08-2025

Easy 4 просмотров