Навчіться будувати пайплайни даних у реальному часі
У сучасних компаніях накопичується великий обсяг даних, з яких можна витягувати
важливу аналітику, будувати гіпотези або прогнозні моделі.
Data Engineer-це фахівець, який збирає дані з різних джерел, очищає їх і передає в зручному вигляді аналітикам для прийняття бізнес-рішень.
Аналітикам даних потрібно знати, як працює сховище даних, в якому вигляді там зберігаються
дані, як вони обробляються і як їх можна отримати для аналізу.
Курс орієнтований на практику і основні інструменти, підходить для тих, хто має базові знання мови Python.
За два місяці ви освоїте всі важливі етапи Data Engineering.
програма курсу
Модулі
1 Вступ, практичний linux
Хто такий Data Engineer і навіщо йому Linux?
2 Сучасні сховища даних
Різноманітність баз даних та їх особливості
3 екосистема Hadoop
Що таке Hadoop, що він вміє і як ним користуватися
4 джерела даних і робота з ними
Файли як джерела даних, JDBC-структуровані дані, SQL для вивантаження даних
5 Apache Spark та обробка даних
Навіщо потрібен Apache Spark і як з ним працювати
6 Hadoop як сховище даних
Особливості та нюанси hdfs
7 Apache Airflow для оркестрації конвеєрів
Налаштування data pipelines
8 огляд хмарних сховищ
Особливості та нюанси роботи з хмарними сховищами: Google, Amazon, Azure
Цей курс входить до Програми Професія "Data Scientist"
У сучасних компаніях накопичується великий обсяг даних, з яких можна витягувати
важливу аналітику, будувати гіпотези або прогнозні моделі.
Data Engineer-це фахівець, який збирає дані з різних джерел, очищає їх і передає в зручному вигляді аналітикам для прийняття бізнес-рішень.
Аналітикам даних потрібно знати, як працює сховище даних, в якому вигляді там зберігаються
дані, як вони обробляються і як їх можна отримати для аналізу.
Курс орієнтований на практику і основні інструменти, підходить для тих, хто має базові знання мови Python.
За два місяці ви освоїте всі важливі етапи Data Engineering.
програма курсу
Модулі
1 Вступ, практичний linux
Хто такий Data Engineer і навіщо йому Linux?
2 Сучасні сховища даних
Різноманітність баз даних та їх особливості
3 екосистема Hadoop
Що таке Hadoop, що він вміє і як ним користуватися
4 джерела даних і робота з ними
Файли як джерела даних, JDBC-структуровані дані, SQL для вивантаження даних
5 Apache Spark та обробка даних
Навіщо потрібен Apache Spark і як з ним працювати
6 Hadoop як сховище даних
Особливості та нюанси hdfs
7 Apache Airflow для оркестрації конвеєрів
Налаштування data pipelines
8 огляд хмарних сховищ
Особливості та нюанси роботи з хмарними сховищами: Google, Amazon, Azure
Цей курс входить до Програми Професія "Data Scientist"
https://privatelink.de/?https://skillfactory.ru/data-engineer