Анализ данных [2022]
Высшая математика
ШАД Helper
Егор Илларионов
Пройдём все темы, обозначенные в требованиях к поступающим в ШАД по анализу данных. Прорешаем задачи прошлых годов. Лекция и семинар каждую неделю.
Автор программы - кандидат физико-математических наук и преподаватель мехмата МГУ - Илларионов Егор.
Цели курса:
- Дать понимание математических основ машинного обучения
- Освоить базовые инструменты чтения и препроцессинга разнородных данных
- Научиться быстро собирать baseline модели и видеть способы улучшения
- Получить навыки командной работы и совместной генерации идей
- Сформировать community для начинающих и более опытных специалистов по анализу данных/машинному обучению.
Модуль 1 - Основные задачи и инструменты машинного обучения.
- Настройка необходимого окружения.
- Полезные ссылки и ресурсы.
- Numpy, работа с числовыми данными, сэмплирование
- Pandas, работа с табличными данными, работа с пропущенными значениями, EDA
- Визуализация данных Matplotlib, задача понижения размерности, PCA
- Препроцессинг и очистка данных, соревнование
- Feature engineering, классификация текстовых данных, соревнование
- Кросс-валидация, соревнование
- Подбор гиперпараметров, соревнование
- Итоговый хакатон, награждение победителей, рекомендации по дальнейшему обучению
https://shadhelper.com/ml