GPDE: GreenPlum для инженеров данных [Школа Больших Данных]
3 дня практического обучения аналитиков, дата-инженеров и администраторов баз данных: анализ Big Data, организация ETL/ELT-процессов, построение корпоративных озер и хранилищ данных с масштабируемой отказоустойчивой open-source СУБД Greenplum Database.
Программа курса GreenPlum для инженеров данных
Часть 1. Основы GreenPlum: GreenPlum как реляционная MPP СУБД
3 дня практического обучения аналитиков, дата-инженеров и администраторов баз данных: анализ Big Data, организация ETL/ELT-процессов, построение корпоративных озер и хранилищ данных с масштабируемой отказоустойчивой open-source СУБД Greenplum Database.
Программа курса GreenPlum для инженеров данных
Часть 1. Основы GreenPlum: GreenPlum как реляционная MPP СУБД
- Введение в GreenPlum
- Архитектура GreenPlum
- Партиционирование таблиц, индексы
- Транзакции и блокировки
- Оптимизация и планы запросов
- Лабораторная работа
- Механизм внешних таблиц, протоколы, PXF
- Загрузка данных в GreenPlum
- Механизм UDF
- Работа с JSON, XML
- Экосистема и дополнительные библиотеки
- Лабораторная работа
- Архитектура озера данных
- ETL, ELT и подготовка данных
- GPSS и интеграция GreenPlum с Kafka и Nifi
- Обработка данных из GreenPlum с помощью Spark
- Построение многоуровневого хранилища на GreenPlum
- Лабораторная работа
https://www.bigdataschool.ru/courses/greenplum-for-data-engineers