Що нового?

Придбаний Python/R for Data Science [2021] [itea online] [Олег Сорокин, Роман Кириченко]

Інформація про покупку
Тип покупки: Складчина
Ціна: 19418 ГРН
Учасників: 0 з 24
Організатор: Відсутній
Статус: Набір учасників
Внесок: 841.4 ГРН
0%
Основний список
Резервний список

Gadzhi

Модератор
Python/R for Data Science [2021]
Itea Online
Олег Сорокин, Роман Кириченко


Python/R for Data Science — это целый комплекс подготовки Data Science-специалистов к работе с большими данными и использованию возможностей программирования в обработке больших данных.

Использование R и Python поможет эффективнее кластеризировать и визуализировать большие массивы данных.


Для кого этот курс
  1. Курс нацелен на Data Scientists, которые имеют базовые навыки программирования и математического анализа.
  2. Также курс будет полезен специалистам, работающим с данными (аналитикам, бизнес-аналитикам, исследователям), которые хотят освоить новые гибкие инструменты для работы с данными.
На курсе ты научишься
  1. Понимать основные алгоритмы машинного обучения и практически их использовать для задач классификации и регрессии.
  2. Делать качественные и интерактивные визуализации данных
  3. Анализировать данные и строить модели машинного обучения с помощью языков Python и R
Содержание
Модуль 1 - Введение в машинного обучения и Data science
  • Определение машинного обучения и науки о данных, их задачи.
  • Инструментарий для анализа данных: языки программирования Python и R.
  • Типы машинного обучения.
  • Составные части модели машинного обучения.
  • Базовые концепты машинного обучения.
Модуль 2 - Основы языков программирования Python и R для Data science
  • IDE для удобной работы: Jupyter, Spyder & Rstudio.
  • Семантика языка
  • Типы данных
  • Структуры данных
  • Операторы контроля исполнения (разветвления и циклов)
  • Векторизация в Python (numpy) i R
Модуль 3 - Функциональное программирование в Python и R
  • Comprehension, Generators, Iterators в Python.
  • Функции в Python i R.
  • Встроенные функции Python.
  • ФункцииApply-family в R.
  • Библиотека purrr для функционального программирования в R.
Модуль 4 - Исследование и подготовка данных к анализу
  • Numpy.
  • Pandas.
  • Фильтрация и агрегация данных в dplyr.
  • Long & wide форматы таблиц, их преобразования в библиотеках pandas & tidyr.
Модуль 5 - Визуализация данных в R и Python
  • Визуализация данных в R.
  • ggplot2 — grammar of graphics.
  • Интерактивная графика в R.
  • Matplotlib & seaborn.
Модуль 6 - Основные понятия статистического анализа
  • Scipy.stats.
  • Описательные статистики.
  • Зависимости между переменными.
Модуль 7 - Типичные проблемы в подготовке данных к анализу
  • Преобразование факторных переменных.
  • Борьба с пробелами в данных.
  • Проблема мультиколлинеарности.
  • Шкалирования данных.
  • Выбор информативных переменных для модели.
  • Типичный алгоритм подготовки данных к моделированию.
Модуль 8 - Базовые регрессионные модели
  • Линейная регрессия.
  • Полиномиальная регрессия.
  • Метод ближайших соседей.
  • Метрики оценки качества регрессии.
  • Тюнинг регрессионных моделей.
Модуль 9 - Базовые модели классификации
  • Логистическая регрессия.
  • Метод опорных векторов.
  • Наивный Байесовский классификатор.
  • Метрики оценки качества классификации.
  • Тюнинг параметров моделей классификации.
Модуль 10 - Базовые модели кластеризации и снижения размерности
  • Метод к-средних.
  • Иерархический кластерный анализ.
  • DBSCAN.
  • Анализ.
  • Корреспонденс-анализ.
Модуль 11 - Деревья решений и ансамбли
  • Базовые древовидные модели.
  • Random forest.
  • Xgboost, lightgbm.
  • Тюнинг гиперпараметров в ансамблевых моделях.
Модуль 12 - Методы улучшения качества моделей машинного обучения
  • Аугментация.
  • Feature engineering.
  • Cross-validation.
  • Борьба с переобучением.
  • Борьба с дисбалансом данных.
  • Регуляризация модели.
Модуль 13 - Введение в архитектуры нейронных сетей. Нейронные сети для классификации изображений
  • Keras.
  • tensorflow.
  • Персептрон.
  • CNN.
Модуль 14 - Прогнозирование временных рядов
  • AR, MA, ARMA.
  • ARIMA.
  • VAR.
  • Lstm.
Модуль 15 - Документация data science проектов, data science in prod
  • Пути организации продакшна для data science-проектов.
  • Специфика документации data science проектов.
  • Markdown, Latex.
Модуль 16 - Практикум по пути улучшения качества моделей
  • Презентация и обсуждение курсовых проектов
  • Подведение итогов курса
Примечание: стоимость курса 325 (EUR)

https://onlineitea.com/course/python-r-for-ds/
 
Угорі