Курс від спеціалістки з Data Science Ганни Пилєвої
Machine Learning для людей
Навчись впевнено використовувати методи машинного навчання в роботі,щоб вони створювали справжнє бізнес-велʼю
Презентація курсу від авторки
Програма курсу
Модуль 0
Тема 1.1. Світ штучного інтелекту
Функції та їх похідні
Тема 2.1 Лінійна та поліноміальна регресія. Методи оцінки точності прогностичної моделі
Тема 2.4 Методи ансамблювання. Кросвалідація
Тема 3.1 Алгоритми кластеризації
Продемонструєте всі набуті навички з EDA, препроцесингу, вибору метрик, моделювання та інтерпретації результатів.
Модуль 4
Тема 4.1 Вступ у NLP
Модуль 7
Модуль 8
Тема 1. Основи SQL та Реляційних баз даних
“Фінальний проєкт” - це максимально наближене завдання до умов реальної роботи в IT-компанії.
Ціна: Від 599 USD
Уроків: 295
Мова курсу: Українська
Machine Learning для людей
Навчись впевнено використовувати методи машинного навчання в роботі,щоб вони створювали справжнє бізнес-велʼю
Презентація курсу від авторки
Програма курсу
Модуль 0
- Змінні, типи даних та базові операції з числами й рядками
- Структури даних: списки, словники, кортежі та їх практичне застосування
- Умовні конструкції та цикли для автоматизації обробки даних
- Функції: створення, параметри та організація коду
- Ключові бібліотеки: NumPy, Pandas, Matplotlib для роботи з даними та візуалізацією
Тема 1.1. Світ штучного інтелекту
- Що таке машинне навчання та як навчаються моделі
- Навігація в світі методів машинного навчання
- Процес розв'язку Data Science задач та інструменти для DS рішень
- З чого почати дослідницький аналіз даних
- Обробка відсутніх значень та аналіз викидів
- Аналіз залежностей між категоріальними змінними
- Що таке Git та чому він такий популярний. Встановлення і конфігурація
- Команди: робота з репозиторієм
- Гілки, pull-ріквести, merge та кращі практики коміту коду
- GUI, історія комітів та що не варто комітити
Функції та їх похідні
Тема 2.1 Лінійна та поліноміальна регресія. Методи оцінки точності прогностичної моделі
- Тестування статистичних гіпотез
- Підведення до задачі лінійної регресії
- Статистичні методи перевірки на гаусовість
- ЦГТ і пошук змінних-кандидатів для побудови лін. регресії
- Поняття лінії та пошук найкращої лінії, яка описує дані
- Вступ до лінійної алгебри. Робота з матрицями і векторами
- Математичне формулювання задачі лінійної регресії
- Припущення лін. регресії. Метод найменших квадратів
- Вимірювання якості регресійної моделі
- Градієнтний спуск для задачі лінійної регресії
- Лінійна регресія багатьох змінних. Виявлення статистичної значущості коефіцієнтів
- Використання категоріальних змінних у моделі машинного навчання
- Удосконалення моделі
- Задачі класифікації. Математичне формулювання логістичної регресії
- Моделювання поліноміальної регресії
- Методи регуляризації в машинному навчанні
- Розв'язок ML задачі step-by-step
- Задача класифікації з Scikit-Learn. Завантаження даних з Kaggle. Заповнення пропущених значень
- Масштабування числових ознак
- Навчання логістичної регресії в scikit-learn та оцінка якості класифікатора
- Класифікація нового значення. Збереження і завантаження моделі. Sklearn Pipelines
- Стратегії вирішення дисбалансу класів у машинному навчанні
- Проблема дисбалансу класів. Random oversampling, undersampling та метод SMOTE
- Метод Adasyn, зв'язки Томека і комбінування oversampling з undersampling
- Мультикласова та мультизначна класифікація
- Ансамблі моделей. Базові техніки
- Задачі мультикласової і мультизначної (multi-label) класифікації
- Вимірювання якості мультикласової класифікації. Приклад мультиклас і мультилейбл класифікації на даних
- Вступ до дерев прийняття рішень
- Принцип побудови дерев прийняття рішень
- Вибір критерія розбиття в процесі побудови дерева
- Умови зупинки в побудові дерева. Prunning. Як витягнути конкретні правила з дерева
- Майстер-клас з перенесення коду з jupyter notebook у Python модуль
- Навчання Decision Trees на практиці
Тема 2.4 Методи ансамблювання. Кросвалідація
- Метод крос-валідації для покращення якості моделі
- Оптимізація гіперпараметрів
- Класифікатор kNN (k-найближчих сусідів)
- Ансамблі моделей. Базові техніки
- Використання просунутих методів ансамблювання: Stacking та Bagging + MK з аналізом помилок класифікації
- Просунуті методи побудови ансамблів
- Алгоритми бустингу. Adaboost
- Градієнтний бустинг. XGBoost, LightGBM. Вибір алгоритму під задачу
- Демо використання бустингових моделей. Тюнінг гіперпараметрів з hyperopt
- Вступ в аналіз часових рядів. Компоненти часових рядів
- Аналіз якості передбачень часових рядів. Автокореляція і часткова автокореляція в часових рядах
- Поняття стаціонарності. Знайомство з базовим функціоналом бібліотеки Darts
- Методи прогнозування часових рядів та їх застосування. Бейзлайн моделі для часових рядів. Exponential smoothing
- Моделі ARIMA/SARIMAX та Theta
- Facebook Prophet, RNN/LSTM, трансформери для прогнозування time series. Розгляд часових рядів з іншою природою
- Backtesting і аналіз помилок в аналізі часових рядів
Тема 3.1 Алгоритми кластеризації
- Вступ до алгоритмів кластеризації у Machine Learning
- KMeans: принцип роботи алгоритму та як визначити оптимальну кількість кластерів
- Ієрархічна кластеризація
- Метод кластеризації DBSCAN. Silhouette метрика для оцінки якості кластеризації
- Вступ до пониження розмірностей даних у машинному навчанні
- Принцип роботи PCA
- Прикладне використання PCA. Візуалізація, зниження шуму, стиснення зображення та аналіз даних за допомогою PCA
- Побудова PCA вручну. Нелінійний алгоритм t-SNE
- Collaborative Filtering і принципи побудови рек. систем
- Рек. системи з fastai
Продемонструєте всі набуті навички з EDA, препроцесингу, вибору метрик, моделювання та інтерпретації результатів.
Модуль 4
Тема 4.1 Вступ у NLP
- Вступ до Natural Language Processing
- Класифікація тексту: основи, препроцесинг, навчання та оцінка ML-моделі
- Векторизація тексту: TF-IDF
- Ембединги слів: Word2Vec, GloVe, FastText (gensim)
- Ембединги BERT та їх застосування
- Файн-тюнінг BERT та інших мовних моделей з HuggingFace
- Парсинг та аналіз тексту
- Парсинг веб-сторінок та аналіз вакансій (HTML, BeautifulSoup)
- Очистка тексту з ChatGPT, WordCloud та n-грами
- Вступ до нейронних мереж
- PyTorch та backpropagation: будуємо першу нейронну мережу
- Feed-forward Neural Networks
- Моделювання послідовностей та принцип роботи RNN
- Архітектура RNN всередині та критерії дизайну рекурентних мереж
- RNN на практиці: від нуля до PyTorch RNN-cell, оверфіт і дебагінг моделі
- Паралельна обробка послідовностей: Attention та архітектура трансформера
- Вступ до MLOps: життя моделі після тренування та способи розгортання
- Деплоймент ML-моделі на Streamlit (практичний гайд)
- Продакшн-деплоймент з FastAPI та Docker
- Алгоритм створення додатків з використанням мовних моделей.
- LangChain: промпти, ланцюги, агенти та робота з пам'яттю
- Порівняння мовних моделей та платформа Hugging Face
- Побудова RAG-додатку: завантаження, індексація, retrieval & generation
- Відстеження роботи LLM в LangSmith та мультиагентні системи з LangGraph
- Вступ до Computer Vision та його застосування
- Робота із зображеннями в PyTorch: підготовка датасету та візуалізація
- Baseline-модель для класифікації зображень з нуля
- Згорткові нейронні мережі (CNN): Conv2d, MaxPool2d та цикли навчання
- Детекція об'єктів: bounding boxes, IoU, mAP
- Семантична та інстанс-сегментація зображень
- Transfer learning для задач класифікації, детекції та сегментації
Модуль 8
- Вступ до рекомендаційних систем: огляд основних підходів
- Постановка задачі, baseline-методи та оцінка якості рекомендацій
- Content-based recommendations та фільтрація на основі змісту на Python
- Колаборативна фільтрація та факторизація матриці
- Сучасні підходи: Vector Space Model та двоетапний retrieval & ranking
- Two Tower Architecture, concat-based підхід та врахування часу
- Покращення рекомендаційних систем: важливі аспекти та метрики
- Як створити ексклюзивне резюме
- LinkedIn, який працює на вас
- Оформлення WOW-портфоліо для Data Science спеціаліста
- Огляд платформи для пошуку роботи Djinni. Реєстрація. Пошук вакансій
- Лайфхаки успішного проходження співбесід
- 250+ питань до технічної співбесіди з відповідями
- Гайд "Платформи для пошуку фріланс-проєктів і фултайм роботи в Україні і країнах Європи"
Тема 1. Основи SQL та Реляційних баз даних
- Що таке SQL та реляційна база даних?
- Термінологія, Зв'язки та Діалекти в SQL
- Синтаксис SQL
- Як користуватись SQL Practice. Приклади найпростіших запитів
- Запити з однієї бази. Фільтрація
- Робота з рядками та датами
- Домашнє завдання №1 на практику SQL
- Робота з JOINs: Пояснення та перші приклади
- Використання JOIN та CASE WHEN
- Об'єднання за допомогою UNION
- Домашнє завдання №2 на практику SQL
- Тема 3. Підключення до бази даних в Python
- Завантаження бази даних локально
- SQL-скрипт та SQL Client
- Підключення до бази в Python: connection, cursor
- Домашнє завдання №3 Python + SQL
- Читання даних за допомогою Pandas
- INSERT, DELETE, UPDATE та close connection
- Classicmodel database (orders)
- Бонус. SQL in Pandas
- Домашнє завдання №4 Pandas + SQL
“Фінальний проєкт” - це максимально наближене завдання до умов реальної роботи в IT-компанії.
- Студенти обирають цікавий для себе набір даних
- Роблять дослідження, візуалізацію даних
- Створюють інтерактивні дашборди
- Використовують SQL, Python, BI-інструмент
- Роблять оформлення за рекомендаціями
Ціна: Від 599 USD
Уроків: 295
Мова курсу: Українська
https://www.dataloves.academy/courses/machine-learning
Останнє редагування модератором: