чим займається Data Scientist
Data Scientist створює і навчає предиктивні моделі за допомогою алгоритмів машинного навчання і нейромереж, допомагаючи бізнесу знаходити приховані закономірності, прогнозувати розвиток подій і оптимізувати ключові бізнес-процеси.
нові знання зроблять вас затребуваним фахівцем в Data Science
Ви навчитеся не тільки працювати з аналітикою, нейронними мережами, Big Data і допомагати компаніям і продуктам рости за допомогою технологій, а й освоїте ключові "м'які навички": комунікацію в команді, цілепокладання і емоційний інтелект.
навчання на курсі допоможе вам:
- Перейти в професію з високим окладом, яка не застаріє через 10 років
- освоїти ключові технології і випередити запит ринку
- прожити Досвід 2-3 років самостійного вивчення сфери Data Science
- новачкам в Data Science
- розробникам
- аналітикам
- працювати з SQL
- використовувати Python і бібліотеки
- перевіряти дані та визначати проблеми
- навчати багатошарові нейронні мережі і будувати моделі машинного навчання
- застосовувати математику в алгоритмах
- лідирувати Data-проекти, працювати в команді і знаходити спільну мову з замовником
1 ступінь. Занурення
- аналітичне мислення (Курсовий проект):
- Що таке аналітичне мислення
- звідки беруться дані
- введення в Google-Таблиці
- Просунута візуалізація даних
- просунуті Google-Таблиці
- Python як інструмент аналізу даних
- основи статистики
- Машинне навчання для життя
- основи візуалізації даних (Курсовий проект):
- навіщо потрібна візуалізація даних
- Зв'язки, потоки, процеси і карти
- інструменти, джерела та передпідготовка даних
- Як розповісти історію за допомогою даних
- основи статистики та способи порівняння метрик
- SQL та отримання даних (Курсовий проект):
- Архітектура та структура баз даних (БД)
- функції SQL та їх аналоги в pandas
- прості запити, join'и, агрегати
- Консоль (знайомство, основні оператори, утиліта psql)
- базові команди в SQL і вбудовані аналітичні функції
- Архітектура та проектування
- імпорт і експорт даних за допомогою SQL і ETL програм
- нормалізація
- принципи роботи з різними БД
- залежності
- основні бібліотеки для підключення до БД з Python
- підготовка та здача підсумкового проекту
- Аналітика великих даних (Курсовий проект):
- Що таке великі дані
- основні характеристики великих даних і види аналізу даних. Просунуті методи аналізу великих даних
- монетизація великих даних
- NoSQL-підхід
- Характеристики та джерела даних
- MapReduce-підхід
- Культура збору даних
- введення в Hadoop
- основи реалізації проектів великих даних. Кейс-стаді
- Практичне завдання (Лабораторна робота) з аналітики даних та його розбір
- Python для аналізу даних (Курсовий проект):
- базові типи даних і цикли
- Базові поняття статистики
- функції та класи
- випадкові події. Випадкові величини
- розширені типи даних: масиви, множини, словники
- логістична регресія та дискримінаційний аналіз
- бібліотеки для аналізу даних: NumPy, Pandas, Matplotlib
- кореляція та кореляційний аналіз
- візуалізація в Python
- довірчі інтервали. Статистична перевірка гіпотез
- Математика для аналізу даних (Курсовий проект):
- Лінійна алгебра. Вектора
- похідна функції декількох аргументів
- Лінійна алгебра. Матриці
- теорія оптимізації
- Просунута Лінійна алгебра
- Теорія ймовірності. Дискретні і безперервні випадкові величини
- Математичний аналіз. Похідна
- Центральна гранична теорема і закон великих чисел
- Машинне навчання:
- регресійний аналіз. Лінійна, поліноміальна та логарифмічна регресія
- оцінка точності моделі, перенавчання, регуляризація
- Класифікація: логістична регресія та SVM
- проблема якості даних
- функції втрат і оптимізація
- Робота з пропусками і змінними
- рекомендаційні системи:
- Неперсоналізовані рекомендаційні системи
- Collaborative Filtering
- Сontent-based-рекомендації
- гібридні алгоритми
- часові ряди:
- знайомство з часовими рядами
- сингулярний спектральний аналіз
- елементарні методи аналізу часових рядів
- випадкові марковські процеси
- моделі ARMA
- нейронні мережі в аналізі часових рядів
- моделі авторегресії умовної гетероскедастичності
- пошук змін у часовому ряді
- нейронні мережі:
- введення в нейронні мережі та бібліотеку keras
- введення в рекурентні мережі
- поглиблення в нейронні мережі і бібліотеку keras
- Автокодировщики
- введення в згорткові нейронні мережі
- введення в генеративно-змагальні мережі
- Комп'ютерне зір:
- виділення ознак і пошук схожих зображень
- Завдання детекції та сегментації
- сегментація та детекція об'єктів
- рекурентні нейронні мережі в задачах комп'ютерного зору (Image Captioning)
- згорткові нейронні мережі
- Породжуючі моделі
- навчання згорткової мережі на практиці
- обробка природної мови:
- введення в автоматичну обробку тексту
- тематичне моделювання
- Структура слова. Морфологія
- інформаційний пошук
- синтаксичний аналіз
- Класифікація в АОТ
- Дистрибутивна семантика
- мовні моделі
- вилучення ключових слів
- Витяг інформації
- словники. Підкріплення знань
- Deep Learning (Курсовий проект):
- регресія і персептрон
- увага: Dense Attention і Beam search
- багатошарова нейронна мережа: регуляризація, градієнтний спуск, прискорення навчання
- комп'ютерне бачення: SSD, Region Based CNN, Faster R-CNN, Masked R-CNN, UNet, перенесення стилю і FCN
- згорткові мережі: згорткові архітектури, багатовимірні згортки, сегментація
- Робота з текстом: мовні моделі, Embeddings, Word2Wec, FastText, NER, Transformer, BERT і Elmo
- рекурентні мережі: RNN, GRU і LSTM, Encoder-Decoder Архітектура
- GAN и: Дискримінатор, генератор, просунуті архітектури
- Менеджмент data-проектів:
- вимоги в data-проектах
- Розробка звітів з дослідження
- методологія ведення data-проектів
- Збереження результатів експерименту
- Ефективні комунікації:
- Комунікації: Синхронізація картини світу
- Емоційний інтелект в переговорах
- Комунікації: мистецтво переконання і структура аргументу
- тренди в тестуванні: за якими ресурсами стежити
- Емоційний інтелект в комунікаціях: етапи розвитку, розпізнавання і управління своїми і чужими емоціями
- Резюме, супровідний лист, портфоліо
- взаємодія в команді:
- Як зміцнити свій авторитет і позиції на роботі
- налагодження вертикальних і горизонтальних зв'язків в колективі
- комунікації на удаленке і ділове листування
- Публічні виступи:
- як презентувати ідею або звіт
- підготовка презентації до публічного виступу
- Як почати отримувати задоволення від виступів і перестати їх боятися
- фінальний хакатон і Kaggle Competitions:
у складі міні-команди за обмежений час і на основі датасетів великих гравців ринку вам доведеться вирішувати завдання з прогнозування продажів або оптимізації виробництва, задіюючи всі знання і навички, отримані на курсі.
Інтеграція та використання machine learning рішень в бізнесі, як правило, має на увазі командну гру, тому хакатон корисний ще й як тренування необхідних soft skills.
підсумковий проект-реальний кейс від Dodo Brands
В рамках дипломного проекту ви зможете побудувати ML-модель для вирішення своїх поточних професійних завдань: це може бути система прогнозування продажів, розпізнавання об'єктів на фото або відео, аналіз часових рядів, аналіз великих обсягів тексту і т. д.
https://privatelink.de/?https://netology.ru/programs/prodatascience