SRE практики и инструменты [OTUS] Часть 1
Это первый курс по SRE в России. Мы рассмотрим все доступные SRE практики и инструменты, будем следовать SRE принципам, поймем как выстраивать SRE процессы и обсудим связь с DevOps. Полученные знания можно сразу применять к своей ежедневной работе и улучшать жизнь себе, коллегам, проекту и компании. В курсе мы подробно разберем современные SRE практики на примерах таких компаний как Google, Facebook, Netflix, Spotify, Evernote, PagerDuty, NewRelic. А также рассмотрим SRE подходы в российских компаниях - Яндекс, Mail.ru, Авито, Badoo, HH.ru. Курс подготовлен на основе опыта, накопленного компанией Экспресс 42, которая на протяжении уже более 5 лет, помогает внедрять DevOps и SRE практики в крупных российских и зарубежных компаниях.
На курсе мы рассказываем про надежность, доступность и эффективность сервисов, про управление изменениями, мониторинг, реагирование на инциденты и производительность своих сервисов. Практические задания будем выполнять на базе следующего технологического стека: Linux, AWS, GCP, Ansible, Salt, Consul, Prometheus, Okmeter, NewRelic, PagerDuty, Perf, Strace, Go, Python.
Кому будет полезен этот курс
Примеры тем проекта:
Скрытое содержимое.
Это первый курс по SRE в России. Мы рассмотрим все доступные SRE практики и инструменты, будем следовать SRE принципам, поймем как выстраивать SRE процессы и обсудим связь с DevOps. Полученные знания можно сразу применять к своей ежедневной работе и улучшать жизнь себе, коллегам, проекту и компании. В курсе мы подробно разберем современные SRE практики на примерах таких компаний как Google, Facebook, Netflix, Spotify, Evernote, PagerDuty, NewRelic. А также рассмотрим SRE подходы в российских компаниях - Яндекс, Mail.ru, Авито, Badoo, HH.ru. Курс подготовлен на основе опыта, накопленного компанией Экспресс 42, которая на протяжении уже более 5 лет, помогает внедрять DevOps и SRE практики в крупных российских и зарубежных компаниях.
На курсе мы рассказываем про надежность, доступность и эффективность сервисов, про управление изменениями, мониторинг, реагирование на инциденты и производительность своих сервисов. Практические задания будем выполнять на базе следующего технологического стека: Linux, AWS, GCP, Ansible, Salt, Consul, Prometheus, Okmeter, NewRelic, PagerDuty, Perf, Strace, Go, Python.
Кому будет полезен этот курс
- Разработчикам, которые развиваются дальше. Те, кто заинтересован в получении опыта эксплуатации сервисов. Те, кто думают о надежности своих сервисов или отвечают за свои сервисы в production окружениях;
- Инфраструктурным и платформенным инженерам, которые начали предоставлять свои платформы как сервис;
- Техническим директорам, руководителям и тимлидам, которые хотят разобраться и внедрить SRE практики и инструменты.
- Опыт из разработки, тестирования или эксплуатации;
- Будет плюсом один из пройденных курсов по разработке в ОТУС;
- Будет плюсом пройденный курс по Linux;
- Будет плюсом пройденный курс по DevOps практикам и инструментам;
Примеры тем проекта:
- Повышение надежности своего сервиса;
- Вывод сервиса в production окружение;
- Покрытие мониторингом своего сервиса;
- Создание процесса управления инцидентами и on-call;
- Тестирование надежности своего сервиса;
- Модуль 1. Введение в SRE
Введение в SRE. Правила SRE и среда эксплуатации
- Модуль 2. Принципы SRE
SLI, SLA, SLO и управление рисками. Автоматизация. Мониторинг. Непрерывная поставка. Снижение рутины и стремление к простоте.
- Модуль 3. Практики SRE
Практика оповещений. Практика on-call. Практика диагностики и решения проблем. Практика реагирования на инциденты. Практика управления инцидентами. Практика постмортемов. Практика управление конфигурацией. Практика управление релизами. Практика управления нагрузкой. Практика предотвращения перегрузок и сбоев. Практика тестирования надежности систем. Практика разрешения конфликтов. Практика конвейера обработки данных. Практика сохранности данных. Практика разработки в SRE. Практика машинного обучения.
- Модуль 4. Управление в SRE
Управление прерываниями и операционной нагрузкой. Жизненный цикл SRE команды. Взаимодействие с SRE.
https://otus.ru/greenlight/sre/