Що нового?

Придбаний Симулятор "SQL для аналізу даних" [Simulative]

Інформація про покупку
Тип покупки: Складчина
Ціна: 6000 ГРН
Учасників: 0 з 60
Організатор: Квітка Квітка
Статус: Набір учасників
Внесок: 104 ГРН
0%
Основний список
Резервний список

Квітка

Модератор
Команда форуму
Це не курс. Це симулятор роботи аналітика даних в реальній компанії з елементами навчання. Ви будете вважати retention і LTV, писати багатоповерхові CTE і робити інші корисні для бізнесу штуки за допомогою SQL.

Цілі симулятора

Навчити не елементарним "SQL-запитам", а корисним фішкам, екосистемі і продакшен-левел коду
Навчити писати запити, потрібні бізнесу. Ви не будете вивчати котиків — ви будете вважати LTV, робити складні агрегації і ad-hoc
Занурити в середу. Ви будете працювати з професійними інструментами-PostgreSQL, DBeaver, MySQL, Power BI і шедулерами
Чим належить займатися

Писати численні ad-hoc SQL запити: збір і валідація email-адрес, розрахунок статистик користувальницької активності і багато іншого
Збирати когорти, аналізувати retention, LTV, CR та інші продуктові метрики за допомогою high-level SQL-запитів
Автоматизувати Імпорт / Експорт даних на Windows / Linux сервері за допомогою SQL + Python + psycopg2 + cron
Програма навчання
Симулятор складається з 13 глав.

Кожна глава-це теорія + практичні завдання + відпрацювання навичок на бізнесових кейсах.

Ви будете аналізувати користувальницький досвід платформи IT Resume, працювати з продакшен-левел інструментами і вирішувати реальні кейси з цікавим сюжетом.


Ви познайомитеся з базами даних, зрозумієте відмінність БД від СУБД, обговоріть важливість нормалізації на конкретних кейсах та інші «основи основ».

В кінці-тест для перевірки знань.

Ви навчитеся підключатися до віддаленої базі 4 різними способами, розберете типи даних і зрозумієте відмінність DCL від DML.

Для закріплення знань - тест.

У цьому розділі ви навчитеся писати базові SQL-запити-але далеко не найпростіші. Також ви освоїте функції обробки тексту, дати, часу, кастингу, круті функції COALESCE/NULLIF, логічні оператори, CASE і багато іншого. Сортування, горизонтальна фільтрація, пошук за шаблоном, регулярки — все це в цьому розділі.

Для закріплення — домашнє завдання.

Хоч ви тільки почали шлях, ви вже будете вирішувати реальні продуктові завдання. Наприклад:
Зберете і підготуєте базу для email-розсилок
Подивіться на користувачів у розрізі дат і пориньте в обробку дати-часу
Справите валідацію номерів телефонів
Розкласифікуєте завдання на платформі за групами залежно від певної ознаки
У цьому розділі ми розповімо про основні продуктові метрики, які стануть в нагоді Вам абсолютно в будь — якому проекті-будь то мобільний додаток або офлайн-магазин. Наприклад, у наступних розділах ви скористаєтеся цими знаннями для аналітики платформи.

Для відпрацювання і закріплення результатів — тест + розрахункові завдання.

Ви навчитеся групувати таблицю за певними ознаками і використовувати агрегатні функції: від найпростіших AVG і MIN до екзотичних mode WITHIN GROUP.

Для відпрацювання навичок — домашнє завдання.

Після цього ви знову відпрацюєте отримані знання на реальних кейсах. Наприклад:
Оцініть розподіл активності користувачів по годинах / днях
Скільки в середньому користувач робить спроб для вирішення 1 завдання? А скільки людей вирішують завдання з першої спроби? А яке значення моди?
Оцініть MAU / WAU / DAU
Порахуєте ефективність реферальної програми
Подивіться на те, як користувачі платформи витрачають і збирають CodeCoins
Тільки вміючи LEFT/RIGHT/FULL/SELF/CROSS / INNER JOIN, ми можемо отримати дійсно щось корисне і осмислене. Саме ці конструкції ви і освоїте в цьому розділі.

Для закріплення — домашнє завдання.

Після цього ви продовжите аналізувати user experience платформи. Наприклад:
Подивіться, хто не тільки вирішує завдання, але і бере участь в інших активностях
Однозначно скажете-від якої компанії скільки користувачів прийшло і як вони себе вели
Оцініть розподіл вирішених завдань і тестів за тегами і категоріями
Рідко рішення задачі можна укласти в один короткий запит. У цьому розділі ви навчитеся писати складні вкладені підзапити і виносити все це акуратно в CTE. А ще обговоримо код-стайл і суміжні питання.

Для закріплення — традиційна домашка.

Після цього закріпіть все на практиці. Наприклад:
Порахуєте RETENTION / CR і подумаємо над тим, як утримати користувачів
Заглибіться в те, як користувачі вирішують завдання і проведете глибоке дослідження
Зберете всю статистику про користувачів в одному місці, щоб показати її рекрутерам
Розберетеся, в чому міць window functions, причому тут взагалі вікна і як уникнути фатальних помилок при використанні UNBOUNDED FOLLOWING/CURRENT ROW. Також навчитеся вважати накопичувальний підсумок і не тільки-використовуючи агрегатні функції, як віконні.

Для відпрацювання-повноцінне домашнє завдання.

Потім ви знову повернетеся до роботи над аналітикою платформи. Наприклад:
Знову розгляньте питання retention і LTV, але під новим соусом
Оцініть динаміку активностей, знайдете ділянки спаду і зростання
Порахуєте поточний баланс накопичувальним підсумком по всім користувачам і знайдете аномалії
У цьому розділі ви самі запроектуєте базу для нового проекту, побудуєте її схему зі зв'язками і напишіть все DDL-скрипти для створення. А в кінці-розгорнете її і в хмарі, і на локальній машині! А щоб базу можна було потестить-наповніть її фейковими даними (так частенько роблять в продакшені) за допомогою спеціальних сервісів.

Будете використовувати: draw.io, DBeaver, MySQL + Workbench, сервіси-фейкери.

У цьому розділі ви навчитеся працювати з psycopg2, mysql.connector, дізнаєтеся про шаблон проектування Singleton, навчитеся реєструвати власні типи даних, працювати з базою через Python, розберете помилки типу Authentication plugin 'caching_sha2_password' cannot be loaded і багато іншого.

Для відпрацювання-повноцінне домашнє завдання.

В результаті ви отримаєте:
кілька готових класів для підключення до основних СУБД, які ви можете використовувати потім на роботі
написані Python-скрипти для експорту-імпорту даних з бази
проект по вивантаженню даних з бази і подальшій обробці в Pandas
У цьому розділі ви навчитеся автоматизувати типові завдання: наприклад, бекапи і інсерти. Робити це будемо за допомогою cron, шедулера і Python-скриптів. На закуску-Airflow.

На виході ви будете мати скрипти та інструкції для автоматизації завдань за допомогою cron, а також готовий проект з Python-кодом для щоденного інсерта даних в БД.

SQL тісно пов'язаний з аналітикою та датавізом. У цьому розділі ви будете підключати базу до Power BI і Redash, щоб будувати ad-hoc звіти і дашборди. Торкнемося теми підключення по ssh, побудови дашбордів і пошуку корисних інсайтів.

В результаті цієї глави ви вирішите реальне тестове завдання у велику Edtech компанію на позицію аналітика.

Наприкінці-невелика ретроспектива всіх ваших напрацювань, а також наші поради щодо тестових завдань, best practices та подальшого розвитку. Корисні матеріали, посилання і непрошені поради — те, що потрібно в кінці такого навчання.

Але насправді, це не кінець, а тільки початок цікавого шляху
Продажник:
https://simulative.ru/sql
 
Угорі