Переглянути вкладення 73300
[Stepik] Big Data for Data Science. 2021 (Олександр Савченко, Ольга Силютина)
Цей курс-програма проекту Stepik Academy. Перед покупкою подивіться, будь ласка, інформацію і програму на сайті проекту.
У повсякденному житті ми користуємося найрізноманітнішими цифровими пристроями, і кожен з нас генерує величезні обсяги інформації за своє життя. І для зберігання і обробки такого обсягу інформації створені спеціальні технології які люблять називати таємничим словом Big Data.
Фахівцям в сфері науки про дані так чи інакше доводиться працювати зі спеціальними сховищами і технологіями, використовуваними для зберігання і обробки великих даних.
В даному курсі ми познайомимося з технологіями зі світу великих даних, розглянемо, як їх можна застосовувати для обробки даних і в машинному навчанні. Розглянемо і вивчимо процеси паралельної і розподіленої обробки великих обсягів даних.
Розберемося, як працюють системи для зберігання великих даних, розглянемо основні принципи обробки таких обсягів даних.
Познайомимося з фреймворками Hadoop, Spark, Airflow, спеціальними сховищами даних HDFS, ClickHouse, а так само з Bi інструментом SuperSet.
Вивчимо роботу розподіленого машинного навчання і його застосування з використанням модуля SparkML.
Ми будемо вирішувати практичні завдання на мовах Python і SQL, тому вам буде потрібно навички програмування на базовому рівні.
Для кого цей курс
Фахівці Data Science і всі ті хто хоче познайомиться з Big Data, а також дізнатися як застосовуються ці технології для зберігання, обробки даних і в машинному навчанні.
початкові вимоги
Базові знання мови Python і SQL.
https://privatelink.de/?https://stepik.org/course/101272/promo