Основы работы с большими данными: Data Science Orientation. Данил Динцис
В процессе деятельности любая компания постоянно ищет новые способы развития: оптимизирует производство, улучшает бизнес-процессы, увеличивает вложения в рекламу и маркетинг, повышает уровень сервиса. Но если успехи компании сходят на нет, зачастую сложно понять, что именно идет не так и почему.
Есть область, ресурсы которой еще не исчерпаны – это Data Science. Накопленные в компании данные, полученные из разных источников, таят в себе огромный потенциал. Грамотный анализ больших объемов разнородных данных (Big Data), выведение скрытых закономерностей приводят аналитиков порой к неожиданным открытиям и выводам. Оперируя этими сведениями, можно вывести свою компанию в лидеры рынка.
Этот курс – введение в сложную и многогранную область науки по работе с большими данными – Data Science.
Вопросы, на которые вы получите ответы:
- Что представляет собой Data Science и как она связана с большими данными (Big Data)?
- Как «приложить» Data Science к вашему бизнесу и нужно ли?
- Какие данные можно использовать для анализа?
- Где именно искать и какие результаты ожидать?
- Руководители компаний и подразделений
- Линейные менеджеры
- Бизнес-аналитики
- Разработчики
- Другие сотрудники, вовлеченные в аналитическую деятельность компании
Вы поймете, как подготовить компанию и сотрудников к практическому применению больших данных (Big Data) в работе.
Вы сможете повысить эффективность принятия решений за счет грамотного сбора, структурирования и применения современных техник анализа больших данных (Big Data).
Модуль 1. Область применения больших данных. Постановка задачи
- Цели курса
- Определение основных понятий
- История науки о данных
- Выгоды от работы с большими данными (Big Data)
- Роль специалистов по DS
- Требуемые компетенции
- Методология исследования данных
- Состав проектной команды для DS
- Требования к команде DS
- С чего начать
- Описательное и ассоциативное исследование исходных данных
- Сегментирование данных (slice and dice)
- Практическая работа. Сегментировать тестовый набор данных
- Основная тенденция и отклонения
- Среднее, наиболее вероятное и медиана
- Распределение Гаусса
- Практическая работа. Определить статистические характеристики распределения. Использовать функции распределения Excel
- Визуализация данных в Excel (Pivot)
- Дашборды
- Другие инструменты визуализации
- Демонстрация
- Основы машинного обучения:
- Сигмоидная функция
- Регрессионный анализ
- Обзор инструментов
- Подготовка компании к применению Big Data
- Требования к компетенциям и взаимодействию сотрудников
- Готовность к изменениям = гибкая (agile) компания
- Практическая работа. Определить состав «бигдата» команды в вашей организации
https://www.specialist.ru/course/ds0