Big Data: основы работы с большими массивами данных
Программа курса:
Программа курса:
- Что такое большие данные
6 часов практики 6 часов теории
История появления науки о данных, определения и термины. Зарождение эры больших данных. Машинные данные и способы их получения, интеграция разнородных данных. Получение больших данных, виды данных. Способы применения больших данных и построение стратегии на их основе. Основы реализации проектов больших данных.
- Методы анализа больших данных
6 часов практики 6 часов теории
Основные характеристики больших данных, типы анализа данных. Основные понятия теории машинного обучения. Классы моделей в машинном обучении, дескриптивный анализ. A/B-тестирование и оптимизация. Основные и продвинутые методы анализа больших данных. Процесс создания модели в машинном обучении.
- Основы систем больших данных
6 часов практики 6 часов теории
Основы программирования для работы с большими массивами данных. Основы архитектуры хранения и обработки больших данных, виды обработки (batch/real-time), инструментарий аналитики больших данных. Основы работы в Hadoop и NoSQL.
- Практика работы с большими данными
4 часа практики 4 часа теории
Разбор алгоритмов применения больших данных и внедрение технологий для оптимизации бизнес-процессов. Практика управление процессами сбора данных и внедрения аналитики. Знакомство на практике с машинным обучением и техонологиями обработки больших массивов информации.
http://netology.ru/programs/big-data