[Нетология] Data Scientist (Вячеслав Мурашкин)курс складається з більш ніж 180 годин відео і домашніх завдань від провідних фахівців з Data Scientist компаній Mail.ru, Ivi і Avito.
Перші два набори вже вдало відбулися, і студенти щосили занурилися в базові алгоритми ML, feature engineering, машинне зір, Data Scientist в e-commerce, часові ряди і прогнозування вартості акцій та інших товарів. Їх викладачами стали експерти з Yandex Data Factory, Rambler & amp;Co, Сбербанк технології і тепер у вас з'явиться можливість отримати всі необхідні знання і навички для роботи в області великих даних.
програма занять
- I
Підготовчий блок
12 годин
Експрес-навчання основним інструментам: Python 3, git, бібліотеки numpy, pandas. Огляд основного математичного апарату: матричні операції, введення в статистику і перевірку гіпотез. - II
Вступ до data science, основні інструменти
12 годин
Що таке Data science, big data, як це працює і де застосовується. Експлоративний аналіз і бібліотеки візуалізації даних. Огляд методів машинного навчання в бібілотеці scikit-learn. - III
Базові алгоритми і поняття машинного навчання
18 годин
Розбір основних задач і алгоритмів машинного навчання: дерева рішень, метод k найближчих сусідів, лінійний Класифікатор і логістична регресія, кластеризація. Перевірка точності моделі. Проблема перенавчання і боротьба з нею: регуляризація, ансамблювання. - IV
Feature engineering
9 годин
Проблеми якості та розмірності даних. Зменшення розмірності даних. Методи декомпозиції. Спрямляющие простору.
- V
Рекомендаційні системи
21 година
Введення в рекомендаційні системи. Неперсоналізовані рекомендації. Персоналізовані рекомендації. Розвиток рекомендаційних систем. - VI
Розпізнавання зображень, машинне зір
27 годин
Базова теорія. Огляд кейсів застосування. Нейромережі. Розбір реальних завдань: рукописне введення, детекція і сегментація об'єктів на зображенні. - VII
Обробка природної мови (NLP)
24 години
Введення в обробку тексту. Огляд існуючих бібліотек, їх використання та доопрацювання. Використання зовнішніх ресурсів. Брудні Тексти: що це таке і як з ними працювати. Дистрибутивна семантика. Чатботы: розбір генерації текстів. Нейромережі для NLP. - VIII
Аналіз часових рядів, прогнозування
9 годин
Часові ряди, моделі ARMA/ARIMA. Складні моделі прогнозування. Эксплоративный аналіз часових рядів. - IX
Спілкування з замовником
9 годин
Проекти машинного навчання: як виявити вимоги і оцінити проект. Складання звітів з досліджень. Майстер-клас з презентації результатів. - X
Data Science в маркетингу та e-commerce
12 годин
Цілі, завдання, рішення та критерії успішності застосування Data Science. Маркетинг Data-Driven vs інтуїція. Типи даних і приклади датасетів. Методи збору з різних джерел. Підготовка та обробка даних, вилучення сенсу та візуалізація. Розбір атрибуції маркетингових витрат для збільшення доходу інтернет-магазину. - XI
Додаткові інструменти, середовища
12 годин
Екосистема Google: BigQuery, Dataflow, Dataproc, Datalab та ін комерційні рішення HP: Vertica, Haven, IDOL, коннектори даних. Рішення від Amazon (AWS). Зберігання та обробка даних в Clickhouse. - XII
Дипломна робота
60 годин
Розробка та впровадження власного ml-рішення/проекту або розробка запропонованого нами кейса
https://netology.ru/programs/data-scientist
Останнє редагування модератором: