Курс Python для анализа данных [2020] [Level UP]
В последние годы язык программирования Python становится более востребованным и популярным по нескольким причинам:
В последние годы язык программирования Python становится более востребованным и популярным по нескольким причинам:
- множество уже готовых удобных библиотек и фреймворков делает этот язык №1 в сфере обработки данных для научных вычислений
- Python для анализа данных используется многими большими компаниями такими, как , Yandex, Google, Facebook, Uber и другими
- простота синтаксиса и освоения позволяют новичкам быстро научиться программировать и решать достаточно сложные задачи
Занятие 1. Анализ табличных данных стандартными средствами Python
- Стандартные типы коллекций (списки, словари и т.д.) и приемы эффективной работы с ними
- Чтение и запись csv и tsv файлов
- Обработка Excel файлов с помощью OpenPyXL.
- Практика: анализ источника данных "Климат городов России"
- ДЗ: решение задач биоинформатики (4 шт).
- Определение СУБД. Немного теории (нормальные формы)
- Операторы SQL.
- Python Database API Specification - для работы с любой СУБД
- Примеры работы со встраиваемой СУБД SQLite
- Практика: создание реляционных таблиц из источника данных "Климат городов России" и выполнение аналитических запросов
- Ndarray - объект многомерного массива
- Математические и статистические операции
- Файловый ввод/вывод массивов
- Немного линейной алгебры
- Генерация случайных чисел.
- Практика: анализ двумерного массива
- Библиотека beautifulsoup для разбора HTML файлов
- Форматы структурированных данных JSON и XML. Примеры практической работы.
- Использование Splinter для автоматизации сбора данных
- Практика: получение данных от веб-сервисов прогноза погоды и расчет обобщенных показателей
- API библиотеки matplotlib
- Линейные и столбчатые диаграммы
- Гистограммы и графики плотности
- Визуализация данных на карте
- Построение интерактивных диаграмм с помощью plotly и bokeh
- Арифметические операции и выравнивание данных
- Редукция и вычисление описательных характеристик
- Обработка отсутствующих данных
- Практика: работа с набором данных рейтинга фильмов
- Комбинирование и слияние наборов данных
- Изменение формы и поворот
- Устранение дубликатов и прочие преобразования данных
- Практика: работа с набором данных рейтинга фильмов
- Группировка с помощью функций
- Группировка по уровням индекса
- Аггрегирование данных
- Групповые операци и ипреобразования
- Сводные таблицы
- Обзор задач машинного обучения и библиотек для их решения
- Построение классификаторов
- Методы кластеризации
- Практика: пример кластеризации сообщений
- Дополнительные возможности NumPy и Pandas
- Обзор интересных сторонних библиотек
- Решение практических задач
- Выборочное повторение пройденного материала
http://levelp.ru/courses/programmirovanie/course-python-for-data-analysis/