SRE. Рецепты выживания в продакшне для инженера по надежности [Наталья Савенкова]
Надежность умирает последней. Главное, чтобы она вообще была. Это можно принять за шутку, если не знать, насколько все серьезно.
Инженер по надежности, с двадцатилетним опытом работы в IT-индустрии, дает 61 полезный совет коллегам, имеющим дело с крупными, а также небольшими системами. Правила написаны емко и по существу, с нотками иронии и юмора, поэтому, даже несмотря на использование профессионального сленга, «пособие для выживания» читается легко. Рецепты основаны на многолетней практике, собственных ошибках и чужих граблях, и они могут стать незаменимой инструкцией для тех, «кто в теме».
Цена 990 руб.
Формат: epub, fb2, fb3, ios.epub, mobi, pdf, txt, zip
Надежность умирает последней. Главное, чтобы она вообще была. Это можно принять за шутку, если не знать, насколько все серьезно.
Инженер по надежности, с двадцатилетним опытом работы в IT-индустрии, дает 61 полезный совет коллегам, имеющим дело с крупными, а также небольшими системами. Правила написаны емко и по существу, с нотками иронии и юмора, поэтому, даже несмотря на использование профессионального сленга, «пособие для выживания» читается легко. Рецепты основаны на многолетней практике, собственных ошибках и чужих граблях, и они могут стать незаменимой инструкцией для тех, «кто в теме».
1. Сервис без вмешательства не переживает отключение части свитчей в дата-центре – это плохой сервис
- Если какую-то процедуру делать страшно – делайте ее чаще
- Если мониторинг не пишет о проблемах – проверьте, возможно, он не работает вообще
- Регулярно проверяйте все редко используемые аварийные средства доступа
- Ходить на чужие разборы полезно
- Если результаты нагрузочного тестирования всегда одинаковые – это плохо
- Регулярно проверяйте всю редко используемую автоматику
- Рандомизируйте учения
- Проектируйте failover смолоду
- Мониторинг трафика в диапазоне
- Мониторинг среднего и min/max
- Не сажайте слона и моську в одну базу
- Расселяйте сервисы – критичные и непредсказуемые
- Exponential backoff
- Учитесь деградировать заранее
- Кеши и заглушки
- Fallback, или «Последний шанс»
- Прогнозируйте нагрузку на смежников
- Прогнозируйте неответы реалтаймовых источников
- Правильно экспериментируйте с сетью
- Никому не верьте
- Стандартизируйте процессы
- Инструкции для «Людочки»
- Не пытайтесь самостоятельно защититься от DDoS и готовьтесь к нему заранее
- Все обновления базы пробуйте на тестовом стенде
- Катите фичу отключенной
- Исследуйте post-mortem’ы
- Устраняйте возможность массовых операций
- Правильно рассчитывайте запас мощности
- Считайте запас критического пути
- Заведите запасной мониторинг
- Умейте быстро отключить любой компонент
- Ставьте маленькие дефолты
- Логируйте сквозной идентификатор запроса
- Соблюдайте рекомендации СИБ
- Доступность из внешнего мира
- Аварийные и предупреждающие оповещения
- Whitelist vs Blacklist
- Debug-mode
- Вечная жизнь скриптов
- Консистентность версий…
- Делайте бэкап перед вмешательством
- Храните все в VCS
- Готовьте заранее план отхода
- Если что-то кажется странноватым – вам не кажется
- Ответственны все
- Регулярно проверяйте схемы rollback'ов
- Оно нерезиновое
- Доверяйте интуиции
- Соблюдайте регламент
- Сокращайте критические секции проводимых работ
- Проводите работы на спаде трафика
- Календарь плановых запусков и работ
- Зафиксируйте термины
- Групповая ответственность
- Работа в полях
- Нативные средства
- Самодостаточная версия
- Факапный чек-лист
- Сделайте мониторинг на все, где есть срок годности
- Знайте свои деструкторы в состоянии стресса
Формат: epub, fb2, fb3, ios.epub, mobi, pdf, txt, zip
https://www.litres.ru/book/natalya-savenkova/sre-recepty-vyzhivaniya-v-prodakshene-dlya-inzhenera-po-70232503/