Курс Анализ данных на Python [2019] [Nordic IT School] [Зохраб Ахундов, Сергей Дормидонтов, Константин Зорин, Андрей Беренда, Вячеслав Жуков]
Что такое анализ данных и с чем его едят?) Мы ежедневно сталкиваемся с разными проблемами и задачами, с разными экспериментами, которые подкидывает нам жизнь. Мы пытаемся добраться до работы оптимальным маршрутом, мы пытаемся распределить свое время между карьерой и личной жизнью таким образом, чтобы ничего из этого не пострадало. Мы ежедневно пытаемся оптимизировать свою целевую функцию - качество жизни. Задача анализа данных состоит в том, чтобы уметь извлекать эту информацию, которую предоставляет нам жизнь и обрабатывать ее так, чтобы максимально эффективно оптимизировать заданную функцию цели.
Что такое анализ данных и с чем его едят?) Мы ежедневно сталкиваемся с разными проблемами и задачами, с разными экспериментами, которые подкидывает нам жизнь. Мы пытаемся добраться до работы оптимальным маршрутом, мы пытаемся распределить свое время между карьерой и личной жизнью таким образом, чтобы ничего из этого не пострадало. Мы ежедневно пытаемся оптимизировать свою целевую функцию - качество жизни. Задача анализа данных состоит в том, чтобы уметь извлекать эту информацию, которую предоставляет нам жизнь и обрабатывать ее так, чтобы максимально эффективно оптимизировать заданную функцию цели.
1. Python
- Jupyter Notebook
- SQL & SQLite
- Pandas
- Matplotlib
- Plotly & Dash
- Scikit-learn
- NLTK & Pymorphy2
- Keras
- BigQuery
-
1. Python
[*]Jupyter Notebook
[*]SQL & SQLite
[*]Pandas
[*]Matplotlib
[*]Plotly & Dash
[*]Scikit-learn
[*]NLTK & Pymorphy2
[*]Keras
[*]BigQuery
- Функции и переменные
- Условия и циклы
- Списки, словари, кортежи, множества
- Объекты, классы, наследование
1.2 Статистика - основные понятия:
- Типы данных (шкал)
- Вероятность, случайная величина, распределение
- Гипотезы, статистическое решение
1.3 Python - прикладные возможности:
- Регулярные выражения
- Работа с файлами
- Работа с интернетом
- Примеры использования API
- Облегчение жизни: логи, tqdm, мультипроцессинг
1.4 SQL:
- Синтаксис запросов
- Создание базы данных
- Работа с базой из Python
- BigQuery
1.5 Статистика - простые методы и их типичные применения:
- Описательные статистики
- Корреляция
- Сравнение групп
- Линейная регрессия
- Бутстреп
2.1 Основы машинного обучения:
- Pandas - супер-таблицы
- Sklearn - машинное обучение
- NLTK и Pymorphy2 - работа с естественным языком
- Matplotlib, plotly, dash - визуализация и дашборды
- Keras - конструктор нейросетей
2.2 Машинное обучение - самые нужные алгоритмы:
- Кластеризация (методы, метрики)
- Классификация (методы, метрики)
- Регрессия (методы, метрики)
- Кратко о нейронный сетях (устройство, виды, преимущества)
- Основы анализа текстов
2.3 Машинное обучение - практические применения:
- Предсказание оттока клиентов
- Рекомендательные системы
- Чат-боты
2.4 Машинное обучение - приемы и хитрости:
- Выбор и генерация признаков
- Что может пойти не так
- Стэкинг, бэггинг, бустинг
Продажник