Sobes Expert - База вопросов технических собеседований

Что такое горизонтальное и вертикальное масштабирование?

Горизонтальное и вертикальное масштабирование

Вертикальное масштабирование (scale up / scale down) — увеличение или уменьшение ресурсов одного узла: больше CPU, RAM, диск, более мощный экземпляр базы данных или виртуальная машина. Пример: заменить сервер с 4 CPU/8 GB на 16 CPU/64 GB или увеличить размер диска.

Плюсы:

простота: обычно достаточно поднять параметры инстанса или добавить ресурсы ОС;
нет необходимости в изменении архитектуры приложения (особенно удобно для stateful-сервисов и монолитов);
часто проще в развертывании и отладке.

Минусы:

физический предел: есть верхняя граница мощности одного узла;
single point of failure — если узел упал, сервис недоступен, пока не сработал failover;
стоимость растёт нелинейно (большие машины дороже на единицу мощности);
возможен даунтайм при апгрейде (зависит от платформы).

Горизонтальное масштабирование (scale out / scale in) — увеличение или уменьшение числа экземпляров сервиса: добавление/удаление серверов, контейнеров или микросервисов за балансировщиком. Пример: вместо одного мощного сервера запускать 10 одинаковых инстансов за load balancer.

Плюсы:

практически линейное увеличение пропускной способности;
повышенная отказоустойчивость (ошибка одного узла не критична);
экономичность на commodity-железе или облачных маленьких инстансах;
гибкость — легко автоматизировать autoscaling.

Минусы:

архитектурная сложность: нужно проектировать распределённую систему (discovery, health checks, балансировка, конфигурация);
распределённые проблемы: согласованность данных, репликация, partitioning;
накладные расходы на сеть и синхронизацию;
stateful компоненты (БД, файловые хранилища) труднее горизонтально масштабировать.

Особенности для разных компонентов

Приложения: stateless-сервисы легко масштабируются по горизонтали; stateful — удобнее вертикально или с внешним хранилищем состояния (Redis, S3, DB).
Базы данных: вертикальный апгрейд — простая стратегия; горизонтальное масштабирование достигается через репликацию (read scaling), шардинг/partitioning (write scaling) или распределённые базы. Каждая техника влечёт trade-offs по согласованности и сложности.
Кэш и очередь: легко масштабируются горизонтально (кластер Redis, Kafka partitions), но требует проектирования partitioning и rebalancing.

Автоматика и эксплуатация

Autoscaling: правило по CPU, latency, queue length или custom SLO-метрике; реактивное (после роста) и предиктивное (по прогнозу).
Warmup / cold start: при масштабировании из-за нулевого инстанса учтите время прогрева (кеши, JIT, загрузка моделей).
Load balancing, service discovery, health checks — обязательные элементы при горизонтальном росте.

Когда что выбирать

Небольшие проекты и stateful системы: вертикаль — быстрее и проще.
Высокая нагрузка, требование отказоустойчивости и горизонтальной эластичности: горизонталь — предпочтительна, но требует разработки под распределённость.

Практические правила проектирования

делать сервисы stateless, выносить состояние в внешние хранилища;
внедрять idempotency и backoff для ретраев;
использовать очереди и кэширование для сглаживания пиков;
тестировать масштабирование (нагрузочные тесты, chaos-drills) и мониторить saturation, latency и queue depth.

14-08-2025

Easy 232 просмотров