Machine Learning. Professional [2022]
OTUS
Мария Тихонова, Дмитрий Сергеев, Андрей Канашов, Максим Пантелеев, Андрей Дзись, Борис Цейтлин, Андрей Сухобок, Антон Лоскутов
Научитесь работать с важнейшими моделями машинного обучения на практике с реальными данными Курс для людей со знанием высшей математики и знакомых с Python. Подготовка к соревнованиям на Kaggle.
Вы последовательно освоите современные инструменты анализа данных и сможете на профессиональном уровне создавать модели машинного обучения.
Для закрепления навыков с каждым алгоритмом вы будете проводить полный pipeline работ от подготовки датасета до анализа результатов и подготовки к продакшену.
Практики и знаний, которые вы получите, будет достаточно, чтобы самостоятельно решать задачи классического ML и претендовать на Junior+ и Middle позиции Data Scientist.
Проекты для портфолио:
В течение курса вы выполните несколько проектов для портфолио и научитесь грамотно презентовать результаты своих работ, чтобы проходить собеседования. Для выпускного проекта вы можете взять один из предложенных преподавателем вариантов или реализовать свою идею.
Для кого этот курс?
- Для начинающих аналитиков и Data Scientist’s. Курс поможет вам систематизировать и углубить свои знания. Вы сможете поэкспериментировать с подходами, разобрать рабочие кейсы и получить качественную обратную связь от экспертов.
- Для разработчиков и специалистов других направлений, желающих сменить профессию и развиваться в области Data Science. Курс даст вам возможность собрать сильное портфолио и погрузиться в атмосферу реальных задач дата сайентиста.
- Best Practices и тренды. Каждый запуск программа обновляется с учетом быстро меняющихся тенденций в Data Science. После обучения вы сразу сможете приступить к работе в реальных проектах.
- Важные второстепенные навыки. В курс входят темы, которые обычно упускаются из внимания, но необходимы специалисту в повседневных задачах и очень ценятся работодателями: — построение систем для автоматического поиска аномалий;— прогнозирования временных рядов при помощи машинного обучения;— end-to-end pipelin’ы по работе с данными, готовые к внедрению в production.
- Творческая атмосфера и условия, близкие к реальным рабочим процессам. Весь курс построен как симулятор рабочих будней дата сайентиста, где вам придется справляться с «грязными» данными, просчитывать свои действия наперед, экспериментировать с решениями и готовить модели в продакшн. В этом деле вам понадобятся любопытство, упорство и жажда нового опыта.
Модуль 1 - Продвинутые методы машинного обучения
Тема 1. Вводный урок. Программа курса. Повторение основных концепций машинного обучения
Тема 2. Деревья решений
Тема 3. Python для ML: пайплайны, ускорение pandas, мультипроцессинг
Тема 4. Ансамбли моделей
Тема 5. Градиентный бустинг
Тема 6. Метод опорных векторов
Тема 7. Методы уменьшения размерности
Тема 8. Обучение без учителя. K-means, EM алгоритм
Тема 9. Обучение без учителя. Иерархическая кластеризация. DB-Scan
Тема 10. Поиск аномалий в данных
Тема 11. Практическое занятие - Построение end-to-end пайплайнов и сериализация моделей
Тема 12. Алгоритмы на графах
Тема 2. Деревья решений
Тема 3. Python для ML: пайплайны, ускорение pandas, мультипроцессинг
Тема 4. Ансамбли моделей
Тема 5. Градиентный бустинг
Тема 6. Метод опорных векторов
Тема 7. Методы уменьшения размерности
Тема 8. Обучение без учителя. K-means, EM алгоритм
Тема 9. Обучение без учителя. Иерархическая кластеризация. DB-Scan
Тема 10. Поиск аномалий в данных
Тема 11. Практическое занятие - Построение end-to-end пайплайнов и сериализация моделей
Тема 12. Алгоритмы на графах
Модуль 2 - Сбор данных. Анализ текстовых данных
Модуль 3 - Анализ Временных рядов
Тема 13. Сбор данных
Тема 14. Анализ текстовых данных. Часть 1: Предобработка и токенизация
Тема 15. Анализ текстовых данных. Часть 2: Векторные представления слов, работа с предобученными эмбеддингами
Тема 16. Анализ текстовых данных. Часть 3: Named Entity Recognition
Тема 17. Анализ текстовых данных. Часть 4: Тематическое моделирование
Тема 18. Q&A
Тема 14. Анализ текстовых данных. Часть 1: Предобработка и токенизация
Тема 15. Анализ текстовых данных. Часть 2: Векторные представления слов, работа с предобученными эмбеддингами
Тема 16. Анализ текстовых данных. Часть 3: Named Entity Recognition
Тема 17. Анализ текстовых данных. Часть 4: Тематическое моделирование
Тема 18. Q&A
Модуль 3 - Анализ Временных рядов
Тема 19. Анализ временных рядов. Часть 1: Постановка задачи, простейшие методы. ARIMA-модель
Тема 20. Анализ временных рядов. Часть 2: Извлечение признаков и применение моделей машинного обучения. Автоматическое прогнозирование
Тема 21. Анализ временных рядов Часть 3: Кластеризация временных рядов (ищем связанные котировки акций)
Модуль 4 - Рекомендательные системыТема 20. Анализ временных рядов. Часть 2: Извлечение признаков и применение моделей машинного обучения. Автоматическое прогнозирование
Тема 21. Анализ временных рядов Часть 3: Кластеризация временных рядов (ищем связанные котировки акций)
Тема 22. Рекомендательные системы. Часть 1: Постановка задачи, метрики качества. Коллаборативная фильтрация. Холодный старт
Тема 23. Рекомендательные системы. Часть 2: Контентная фильтрация, гибридные подходы. Ассоциативные правила
Тема 24. Рекомендательные системы. Часть 3: Implicit feedback
Тема 25. Практическое занятие по рекомендательным системам. Surpsise
Тема 26. Q&A
Модуль 5 - Дополнительные темыТема 23. Рекомендательные системы. Часть 2: Контентная фильтрация, гибридные подходы. Ассоциативные правила
Тема 24. Рекомендательные системы. Часть 3: Implicit feedback
Тема 25. Практическое занятие по рекомендательным системам. Surpsise
Тема 26. Q&A
Тема 27. Kaggle тренировка по ML №1
Тема 28. Kaggle тренировка по ML №2
Тема 29. ML в Apache Spark
Тема 30. Поиск Data Science работы
Модуль 6 - Проектная работаТема 28. Kaggle тренировка по ML №2
Тема 29. ML в Apache Spark
Тема 30. Поиск Data Science работы
Тема 31. Выбор темы и организация проектной работы
Тема 32. Предзащита проектных работ №1
Тема 33. Предзащита проектных работ №2
Тема 34. Защита проектных работ
Тема 32. Предзащита проектных работ №1
Тема 33. Предзащита проектных работ №2
Тема 34. Защита проектных работ
https://otus.ru/lessons/machinelearning/?int_source=courses_catalog&int_term=data-science