[Podlodka] TechLead Crew. Сезон 4. Наблюдаемость: мониторинг, оповещение, трассировка
В четвертом сезоне Techlead Crew обсуждаем практики и подходы к определению внутреннего состояния системы:
- Чем поможет измерение надежности системы;
- Как научить распознавать потенциальные катастрофы на проде;
- Как устроено SRE в разных компаниях;
- Как эффективно работать с post mortem.
- Доклад: SRE. Чему нас научил Google/Дмитрий Масленников
- Доклад: Какие такие Метрики или как делать не надо"/Маргарита Ольшанская
- Доклад: Измерение надежности системы/Павел Лакосников
- Круглый стол: Как устроено SRE в разных компаниях/Дмитрий Масленников, Михаил Фесенко, Сергей Бухаров, Максим Гусев
- Доклад: Какую (ещё) пользу можно извлечь из распределённых трассировок?/Григорий Кошелев
- Доклад: Как мы структурировали хаос в Озоне/Дина Сафина
- Интервью: SRE культура/Максим Гусев
- Доклад: SRE: Что это и как выглядит готовое блюдо/Ганна Новикова
- Воркшоп: Разбираем Post mortem/Олег Федоткин
- Доклад: "Когда вы перестанете косячить на проде?"/Михаил Дружинин
https://privatelink.de/?https://podlodka.io/crew-records