Чему вы научитесь:
После прохождения курса вы сможете полностью решать классические задачи анализа данных: начиная от сбора и хранения данных и заканчивая внедрением обученных моделей в продакшн.
Спойлер: Содержание
Организация курса
Продажник:
- Изучите классические и современные алгоритмы машинного обучения
- Повторите или освоите математические подходы, необходимые для анализа данных
После прохождения курса вы сможете полностью решать классические задачи анализа данных: начиная от сбора и хранения данных и заканчивая внедрением обученных моделей в продакшн.
Спойлер: Содержание
Организация курса
- О курсе
- Инструменты
- Kaggle
- Глоссарий
- Введение
- Основные понятия машинного обучения
- Типы задач в машинном обучении
- Схема проекта по машинному обучению
- Оценка обобщающей способности модели
- Домашнее задание
- Разведочный анализ данных
- Основы линейной регрессии
- Регуляризация
- Практические особенности линейной регрессии
- Feature engineering
- Метрики качества регрессии
- Градиентный спуск для функции одной переменной
- Градиентный спуск в общем случае
- Стохастический градиентный спуск
- Переход от регрессии к классификации
- Задача оценивания вероятностей, логистическая регрессия
- Базовые метрики классификации
- Работа с пропущенными значениями
- Нормализация данных
- Кодирование категориальных признаков
- Метод опорных векторов
- Ядровой метод опорных векторов
- Продвинутые (интегральные) метрики классификации
- Многоклассовая и multilabel-классификация
- Метод ближайших соседей
- Быстрый поиск соседей
- Домашнее задание
- Решающее дерево. Введение
- Обучение решающих деревьев
- Тонкости решающих деревьев
- Домашнее задание
- Разложение ошибки на смещение и разброс
- Бэггинг. Случайный лес
- Бустинг. Градиентный бустинг над решающими
деревьями - Домашнее задание
- XGBoost
- CatBoost
- LightGBM
- Optuna
- Домашнее задание
- Постановка задачи и разведочный анализ данных
- Построение базового решения и его первые улучшения
- Дальнейшие улучшения решения
- Получение предсказания и интерпретация результатов
- Соревнование
- Методы отбора признаков
- Метод главных компонент
- Другие способы снижения размерности
- Методы визуализации данных
- Домашнее задание
- K-means
- Иерархическая кластеризация
- DBSCAN, HDBSCAN
- Метрики качества кластеризации
- Графовая кластеризация
- Домашнее задание
Продажник:
https://privatelink.de/?https://stepik.org/course/125501/promo#toc