На курсе вы:
- Научитесь строить дата-пайплайны и выстраивать эффективную работу дата-архитектуры
- Разберетесь в инструментах для управления данными
- Выполните реальный проект на собственных данных под руководством опытных экспертов
Python, AirFlow, Bash, NiFi, Hadoop, Kafka, Spark, Neo4j, PostgreSQL, MongoDBl, ClickHouse
ПРОГРАММА КУРСА
- Введение.
- Python и терминал для задач Data Engineering.
- Распределенные файловые системы. Hadoop. Map-Reduce.
- Spark for Data Engineering.
- Реляционные базы данных.
- NOSQL базы данных и введение в методологии построения хранилищ.
- Процессинг и перекладывание (перекладка) данных.
- Оркестраторы данных. AirFlow.
- Шины данных. Kafka. Принципы построения систем потоковой аналитики.
- ETL-инструменты. NiFi.
- Архитектура хранилищ данных.
- Аналитика. Жизненный цикл данных и оценка data quality.
- Работа с собственным проектом в финальном модуле.
- Заключение
https://slurm.io/data-engineer