Освойте основні операції з файловою системою HDFS.
Які перспективи відкривають навички роботи з HDFS:
Які перспективи відкривають навички роботи з HDFS:
- На інтенсиві ви дізнаєтеся про середовище для роботи з великими даними-Apache Hadoop, а також навчитеся працювати з основоположним компонентом фреймворку Apache Hadoop: HDFS.
- Hadoop Distributed File System (HDFS) – розподілена файлова система, що дозволяє зберігати інформацію практично необмеженого обсягу. HDFS є невід'ємною частиною екосистеми Hadoop, куди входять фреймворки Spark, Hive, HBase та інші. Hadoop Distributed File System активно використовують і інші напрямки Big Data, включаючи підготовку і аналіз даних, а також аналітичні системи на базі алгоритмів машинного навчання (Machine Learning).
- Тим, хто починає занурюватися в сферу BigData
- Тим, хто хоче глибше дізнатися внутрішній устрій розподіленої файлової системи HDFS
- Розуміти, навіщо потрібні великі дані (Big Data)
- Розбиратися, як влаштована HDFS, її складові
- Знати переваги та недоліки HDFS
- Вміти записувати і читати дані в/з HDFS
- Дослідити файлову систему HDFS з точки зору системного адміністратора
- Навіщо потрібні великі дані
- Розподілені файлові системи. Файлові системи HDFS. Їх складові. Їх переваги, недоліки і сфера застосування
- Читання і запис в HDFS
- HDFS APIs: Web API, shell, Python API.
- Форма закріплення знань-тестування і виконання домашньої роботи
https://privatelink.de/?https://fpmi-edu.ru/hdfs