[digitaltech.school] Питон: Машинное обучение и Большие данные
Data Science / Python / Machine learning
Все больше компаний осознают значение данных и понимают условия правильной работы с ними для увеличения эффективности всего бизнеса. А профессионалы в области data science в настоящее время становятся одними из самых востребованных на рынке. В рамках это практического курсы мы заложим основу работы с данными с помощью языка Python и рассмотрим реализацию алгоритмов машинного обучения для решения типичных задач специалиста data scientist.
Для кого
28/03/2017
Преподаватель:
Сергей Лисицын
Продажник:
Скрытое содержимое.
Data Science / Python / Machine learning
Все больше компаний осознают значение данных и понимают условия правильной работы с ними для увеличения эффективности всего бизнеса. А профессионалы в области data science в настоящее время становятся одними из самых востребованных на рынке. В рамках это практического курсы мы заложим основу работы с данными с помощью языка Python и рассмотрим реализацию алгоритмов машинного обучения для решения типичных задач специалиста data scientist.
1. Data Science & Python (3 занятия)
1.1. Введение в Python
2. Machine learning (5 занятий)
2.1. Введение в машинное обучение
2.3. Непараметрические модели: метод ближайшего соседа и метод опорных векторов (SVM); Обучение без учителя (unsupervised learning): кластеризация и понижение размерности
2.4. Обучение деревьев классификации и регрессии (CART)
2.5. Нейронные сети (deep learning)
Практические занятия
Каждое занятие ориентированно на практическое применение Python для анализа данных, вас также ждет много практики и домашних заданий по машинному обучению.
1.1. Введение в Python
- История возникновения Python
- Преимущества и недостатки
- Синтаксис языка
- Типы данных
- Функции
- ООП — объектно ориентированное программирование
- Pythonic идиомы
- Мультипоточность
- IPython + JupyterHub
- Работа с файлами
- Регулярные выражения
- Парсинг текстов (beautiful soup, nltk, и др)
- Другие форматы — JSON, XML
- Параллельная обработка
- Pandas
- Matplotlib/Ggplot
- Sklearn
- Numpy, Scipy
2. Machine learning (5 занятий)
2.1. Введение в машинное обучение
- Повторение необходимых элементов теории вероятностей и линейной алгебры
- Виды обучения и виды типичных задач
- Когда нужно и когда не нужно машинное обучение
- Градиентный спуск, целевые функции для обучения моделей
- Хэширование признаков (hashing trick)
- Квадратичные и кубические признаки
2.3. Непараметрические модели: метод ближайшего соседа и метод опорных векторов (SVM); Обучение без учителя (unsupervised learning): кластеризация и понижение размерности
- Метод ближайшего соседа
- Метод опорных векторов (SVM)
- Иерархическая кластеризация и алгоритм k-means
- Понижение размерности: алгоритмы MDS и PCA
2.4. Обучение деревьев классификации и регрессии (CART)
- Энтропия и алгоритм ID3
- Бустинг и бэггинг для построения ансамблей
2.5. Нейронные сети (deep learning)
- Композиционность и обучение представлений (representation learning)
- Градиентный спуск, дифференцирование сложных функций
- Типичная структура сети, целевые функции и используемые слои
- Свёрточные нейронные сети
Практические занятия
Каждое занятие ориентированно на практическое применение Python для анализа данных, вас также ждет много практики и домашних заданий по машинному обучению.
- Аналитики
- Разработчики
- Менеджеры, которые хотят погрузиться в технические детали
- Студенты технических специальностей
- Базовое представление о программировании
- Базовое знание статистики и теории вероятности
28/03/2017
Преподаватель:
Сергей Лисицын
Продажник:
Скрытое содержимое.
http://digitaltech.school/courses/data-science-and-python/
https://tg030.skladchik.org/threads/oreilly-%D0%9F%D1%80%D0%BE%D0%B3%D1%80%D0%B0%D0%BC%D0%BC%D1%8B-%D0%B2%D1%8B%D0%BC%D0%BE%D0%B3%D0%B0%D1%82%D0%B5%D0%BB%D0%B8-%D0%97%D0%B0%D1%89%D0%B8%D1%82%D0%B0-%D0%BE%D1%82-%D1%86%D0%B8%D1%84%D1%80%D0%BE%D0%B2%D0%BE%D0%B3%D0%BE-%D0%B2%D1%8B%D0%BC%D0%BE%D0%B3%D0%B0%D1%82%D0%B5%D0%BB%D1%8C%D1%81%D1%82%D0%B2%D0%B0-2016.147843/