програма
30 + онлайн-уроків, більше 65 годин навчального контенту і практика після кожного заняття
тривалість: 5 місяців.
Модуль 1. Теорія ймовірностей і математична статистика
Модуль 2. Бібліотеки Python для Data Science: Numpy, Matplotlib, Scikit-learn
Модуль 3. Бібліотеки Python для Data Science: продовження
Модуль 4. Алгоритми аналізу даних
Модуль 5. Системи машинного навчання в Production
Чому варто вивчити машинне навчання?
За два роки попит на Data Scientist-ів виріс в два рази*. За допомогою методів машинного навчання вони будують прогнози і підвищують ефективність бізнес-процесів в будь-якій галузі. Отримайте затребувану професію і заробляйте
від 100 000 рублів на місяць.
що корисного в курсі?
Багато практики
Ви вирішите п'ять проектних завдань із застосуванням ML: передбачення ціни на нерухомість, модель кредитного скорингу та інші.
Живі заняття
В курсі 90% вебінарів з викладачами.
Матеріали
Після занять у вас залишаться записи, методичні матеріали і готовий код, доступні в будь-який час.
Кому точно варто брати участь
- Початківцям Data Scientist-ам
Систематизуєте та поглибите знання, поспілкуєтеся з експертами та поповните резюме практичними проектами
- Аналітикам
Зможете не обмежуватися базовою аналітикою і впроваджувати моделі Machine Learning, що прогнозують різні показники
- Розробникам
Перейдете в сферу Data Science, підвищите рівень доходу і будете вирішувати цікаві завдання
Математикам
Застосуйте знання до нових завдань і освоїте затребувану професію
програма
30 + онлайн-уроків, більше 65 годин навчального контенту і практика після кожного заняття
Теорія ймовірностей і математична статистика
Розвідувальний аналіз даних (EDA) на основі обраного датасета: візуалізація, кореляційний, дисперсійний і факторний аналіз
бібліотеки Python для Data Science: Numpy, Matplotlib, Scikit-learn
Змагання на платформі Kaggle з передбачення ціни на нерухомість, вирішення завдання регресії
бібліотеки Python для Data Science: продовження
Змагання на платформі Kaggle з кредитного скорингу, вирішення завдання класифікації
алгоритми аналізу даних
Участь в одному або двох змаганнях на Kaggle: передбачити середній бал на іспиті з математики, який отримують учні репетиторів (завдання регресії); передбачити, чи підійде репетитор для підготовки до іспиту з математики (завдання класифікації)
системи машинного навчання в Production
Оцінка потенційного впливу на бізнес ml-рішення, побудова моделі відтоку клієнтів в ігрових проектах і підготовка коду для Production в PyCharm
- випадкові події. Умовна ймовірність. Формула Байєса. Незалежні випробування
- дискретні випадкові величини. Закон розподілу ймовірностей. Біноміальний закон розподілу. Розподіл Пуассона
- Описова статистика. Якісні та кількісні характеристики популяції. Графічне представлення даних
- безперервні випадкові величини. Функція розподілу і щільність розподілу ймовірностей. Рівномірний і нормальний розподіл. Центральна гранична теорема
- перевірка статистичних гіпотез. P-значення. Довірчий інтервал. A/B-тестування
- Взаємозв'язок величин. Параметричні та непараметричні показники кореляції. Кореляційний аналіз
- багатовимірний Статистичний аналіз. Лінійна регресія
- дисперсійний аналіз. Логістична регресія
Розвідувальний аналіз даних (EDA) на основі обраного датасета: візуалізація, кореляційний, дисперсійний і факторний аналіз
бібліотеки Python для Data Science: Numpy, Matplotlib, Scikit-learn
- введення в курс. Вебінар
- обчислення за допомогою Numpy. Робота з даними в Pandas. Відеоурок
- обчислення за допомогою Numpy. Робота з даними в Pandas. Вебінар
- Візуалізація даних в Matplotlib. Відеоурок
- Візуалізація даних в Matplotlib. Вебінар
- навчання з учителем в Scikit-learn. Відеоурок
- навчання з учителем в Scikit-learn. Вебінар
- навчання без вчителя в Scikit-learn. Відеоурок
- навчання без вчителя в Scikit-learn і введення в підсумковий проект. Вебінар
- консультація за підсумковим проектом. Вебінар
Змагання на платформі Kaggle з передбачення ціни на нерухомість, вирішення завдання регресії
бібліотеки Python для Data Science: продовження
- введення в завдання класифікації. Постановка задачі та підготовка даних
- аналіз даних та перевірка статистичних гіпотез
- побудова моделі класифікації
- оцінка та інтерпретація отриманої моделі. Обговорення курсового проекту
Змагання на платформі Kaggle з кредитного скорингу, вирішення завдання класифікації
алгоритми аналізу даних
- Алгоритм лінійної регресії. Градієнтний спуск
- масштабування ознак. L1-і L2-регуляризація. Стохастичний градієнтний спуск
- логістична регресія. Log Loss
- Алгоритм побудови дерева рішень
- випадковий ліс
- градієнтний бустинг (AdaBoost)
- Класифікація за допомогою KNN. Кластеризація k-means
- зниження розмірності даних
Участь в одному або двох змаганнях на Kaggle: передбачити середній бал на іспиті з математики, який отримують учні репетиторів (завдання регресії); передбачити, чи підійде репетитор для підготовки до іспиту з математики (завдання класифікації)
системи машинного навчання в Production
- введення в завдання передбачення відтоку. Формалізація завдання і збір сирих даних
- завантаження даних і побудова навчальної вибірки. Аналіз і передобробка датасета. Балансування КЛАСІВ
- вибір і навчання моделі на відібраних ознаках. Порівняння якості та оцінка моделі
- оцінка потенційного впливу на бізнес. Масштабування рішення
- Підготовка до продакшену. Планувальник завдань і перенесення проекту з Jupyter в PyCharm
Оцінка потенційного впливу на бізнес ml-рішення, побудова моделі відтоку клієнтів в ігрових проектах і підготовка коду для Production в PyCharm
https://privatelink.de/?https://machinelearning.geekbrains.ru/