Що нового?

Придбаний Основы Data Science [2021] [it-academy] [Роман Сидоренко]

Інформація про покупку
Тип покупки: Складчина
Ціна: 58601 ГРН
Учасників: 0 з 12
Організатор: Відсутній
Статус: Набір учасників
Внесок: 5078.8 ГРН
0%
Основний список
Резервний список

Gadzhi

Модератор
Основы Data Science [2021]
it-academy
Роман Сидоренко


Курс по Data Science направлен на приобретение знаний, навыков и умений по извлечению, структурированию и использованию полезной информации из неструктурированных, а также разрозненных источников.

Он охватывает основные современные средства Data Mining, Machine Learning и Big Data.
Использование указанных технологий даёт неоспоримое преимущество не только организациям на рынке товаров и услуг, но и людям на рынке труда.

Для кого этот курс
  1. Для разработчиков, желающих расширить свои компетенции;
  2. Для студентов старших курсов и выпускников технических ВУЗов, которые хотят повысить свои шансы на трудоустройство;
  3. Для аспирантов и соискателей научных степеней, желающих приобрести навыки решения научных и исследовательских задач с использованием современных информационных технологий;
  4. Для специалистов, желающих повысить свою компетенцию в области Data Mining, Big Data и Data Science.
Для чего этот курс
  1. Приобретения знаний в областях Data Mining, Big Data и Data Science;
  2. Формирования устойчивых навыков и умений по постановке и решению аналитических и исследовательских задач с использованием математической статистики и современных информационных технологий, а также разработки информационных рекомендательных систем.
Вы будите уметь
  1. Осуществлять сбор, обобщение и очистку исходных информационных данных;
  2. Находить аналитические зависимости в структурированных и неструктурированных данных;
  3. Осуществлять постановку и решение задач математического программирования и исследования операций;
  4. Знать и уметь применять основные алгоритмы машинного обучения и математического программирования;
  5. Знать, как работает Machine Learning;
  6. Уметь пользоваться основными инструментами Data Mining, Big Data и Data Science;
  7. Знать основные типы и архитектуру нейронных сетей;
  8. Реализовывать, внедрять и обучать Machine Learning модели;
  9. Решать задачи Computer Vision, Natural Language Toolkit, а также прогнозирования временных рядов;
  10. Знать концепции Map Reduce и CUDA;
  11. Знать принципы функционирования высоконагруженных систем;
  12. Разрабатывать рекомендательные системы.
Содержание
Модуль 1 - Введение в Data Science
  • Объект Data Science.
  • Взаимосвязь Data Mining, Big Data и Data Science.
  • Инструментарий Data Science.
  • Основные способы получения данных.
  • Базовый эксплоративный анализ и визуализация данных.
Модуль 2 - Математические основы Data Science
  • Основы матричного исчисления.
  • Реализация матричных операций в Python.
  • Основы теории вероятности и математической статистики.
  • Проверка статистических гипотез в Python.
  • Основы математического программирования и исследования операций.
  • Классификация алгоритмов математического программирования.
  • Визуализация данных в Python.
Модуль 3 - Основы Data Science и Machine Learning
  • Принципы построения моделей в Data Science.
  • Метрики качества моделей. Проверка качества модели.
  • Введение в Deep Learning и Machine learning.
  • Объект Deep Learnig и Machine Learning. Классы решаемых задач.
  • Большие данные и параллельные вычисления.
  • Подходы к построению высоконагруженных систем.
  • Обобщение и сбор данных для обучения их очистка и нормализация.
  • Обзор и классификация алгоритмов ML.
Модуль 4 - Основные алгоритмы Machine Learning
  • Алгоритмы «Дерево решений», «Случайный лес», «K-ближайших соседей», «Градиентный бустинг».
  • Кластеризация и поиск ассоциаций.
  • Линейная и логистическая регрессия. Ограничения, преимущества и недостатки.
  • Обучение с учителем.
  • Обучение классификатора на размеченных данных.
  • Проверка качества модели: переобучение, регуляризация, обучающая и тестовая выборки.
  • Борьба с переобучением: ансамблирование. Обзор методов ансамблирования.
  • Реализация алгоритмов в Python.
Модуль 5 - Методы предобработки данных
  • Снижение размерности, разреженные данные, многомерные пространства.
  • Коррелирующие параметры.
  • Нерациональное использование памяти, сложность моделей.
  • Статистический анализ данных, выбор параметров на основе корреляции.
  • Снижение размерности данных: поиск подмножеств, регуляризация, уменьшение пространства.
  • Векторное разложение.
  • Методы декомпозиции.
  • Спрямляющие пространства.
Модуль 6 - Рекомендательные системы
  • Введение в рекомендательные системы.
  • Различие между предсказаниями и рекомендациями.
  • Типы рекомендательных систем.
  • Постановка целей.
  • Неперсонализированные рекомендации.
  • Способы построения рекомендательных систем.
  • Цепи Маркова.
  • Групповые рекомендации.
Модуль 7 - Распознавание изображений, машинное зрение
  • Теоретические основы обработки изображений.
  • Форматы данных (RGB, CMYK, B&W), принципы и алгоритмы сжатия изображений, примеры чтения и конвертации изображений.
  • Выделение признаков изображений.
  • Задача поиска изображения по шаблону, представление свойств изображения с помощью гистограмм.
  • Поиск похожих картинок по контенту.
  • Сегментация изображений, детекция объектов.
  • Детектор лиц на изображении.
Модуль 8 - Введение в нейронные сети
  • Основные элементы нейронных сетей.
  • Классификация архитектур нейронных сетей.
  • Обучение: функция потерь, обратное распространение ошибки, стохастический градиент.
  • Регуляризация.
  • Инициализация весов.
  • Сверточные нейронные сети.
  • Практическое применение сверточных рекурентных и генеративно-конкурирующих сетей в задачах Computer Vision.
Модуль 9 - Распознавание естественного языка
  1. Введение в обработку текста.
  2. Частотный анализ.
  3. Законы Ципфа и Хипса.
  4. Морфологический и синтаксический анализ.
  5. Векторная модель и методы снижения размерности в ней.
  6. Классификация текстов.
  7. Извлечение именованных сущностей.
  8. Языковые модели.
  9. Извлечение информации.
  10. Генерация текстов.
Модуль 10 - Временные ряды
  • Временные ряды.
  • Модели построения прогнозов.
  • Разложение временного ряда на компоненты.
  • Автокорреляция и корелограммы.
  • Стационарность ряда.
  • Сложные модели прогнозирования.
  • Прогнозирование временных рядов на цепях Маркова.
Модуль 11 - Общение с заказчиком. Требования к Data Science проектам
  • Cпособы выяснения требований, проверка их выполнимости.
  • Формализация и утверждение требований с заказчиком.
  • Общий порядок составления отчетов.
  • Цели, явные и неявные ожидания заказчиков проекта.
  • Описание зависимостей и способов воздействия на важные для заказчика факторы.
  • Практический опыт создания хайлоад моделей.
  • Выбор алгоритмов, библиотек, тонкой настройки моделей.
Модуль 12 - Подведение итогов
  • Защита дипломных проектов.
Примечание: полная стоимость курса 2 999 (BYN)

https://www.dist.it-academy.by/course/osnovy-data-science/osnovy-data-science/
 
Угорі