чому ви навчитеся
- процес і модель машинного навчання
- заповнення пропусків в даних
- лінійна регресія і L1/L2 регуляризація
- вирішальні дерева та ансамблі стекінгу
- кореляція та взаємна інформація
- метод головних компонент (PCA)
- сингулярне розкладання (SVD)
- аналіз незалежних компонент (ICA)
- багатовимірне шкалювання (MDS)
- t-SNE, UMAP, LargeVis
- просунутий Python
- основи математичної статистики
Ми розберемо завдання хакатона 2020 року по виділенню факторів, найбільшою мірою впливають на тривалість життя в Росії, з точки зору фундаментальних і прикладних підходів до зниження розмірності даних. У висновку побудуємо ансамбль моделей для передбачення тривалості життя, базуючись на виділених факторах.
Курс розбитий на 4 частини.
У першій частині ми послідовно пройдемо всі етапи роботи з даними: від видів завдань і їх постановки до роботи з моделями машинного навчання для мінімізації передбачувальної помилки. Додатково розглянемо фундаментальні основи побудови моделей машинного навчання, базові метрики і найбільш прості моделі - лінійну регресії, вирішальні дерева і випадковий ліс. А також ансамблі машинного навчання.
у другій частині на практиці розберемо:
- очищення і передобробку даних-ETL
- лінійну регресію для екстраполяції даних
- лінійну регресію з регуляризацією для виділення факторів
- Інформаційні критерії зниження розмірності
третя частина присвячена матричним методам:
у четвертій частині розглянемо нелінійні підходи:
для кого цей курс:
- метод головних компонент (PCA)
- сингулярне розкладання (SVD)
- аналіз незалежних компонент (ICA)
- позитивно-визначені матриці (NMF)
у четвертій частині розглянемо нелінійні підходи:
- багатовимірне шкалювання (MDS).
- t-SNE
- UMAP
- LargeVis
для кого цей курс:
- аналітики Python, що вивчають Машинне навчання
- програмісти великих даних
- дослідники великих даних
https://privatelink.de/?https://www.udemy.com/course/ittensive-machine-learning-features/