початок занять
25 жовтня, 4 місяці.
що дасть вам цей курс
Зазвичай математику у вузах викладають у відриві від реальних завдань, де вона надалі буде застосовуватися. Ми пішли іншим шляхом. Кожен модуль професійного курсу збалансований математичною теорією і практичними прикладами, які взяті з реальних кейсів. Ви будете вирішувати завдання регресії, проводити АБ-тестування, працювати над рекомендаційною системою, використовувати метод опорних векторів.
Для кого цей курс?
Курс підійде всім, хто хоче розвиватися в сфері Data Science. Він допоможе вам освоїти весь необхідний математичний апарат для вирішення завдань на позиції Middle/Senior Data Scientist.
Навіщо вчити математику?
Професія Data Scientist стає однією з найперспективніших і затребуваних в IT. Середня зарплата фахівців Data Science в Росії вдвічі вище, ніж у фахівців інших IT-напрямків — 190 тис.руб. основна складність професії — високі вимоги до знань вищої математики. Впевнене володіння математичним апаратом дозволяє підвищити рівень компетенцій і вирости в професійному плані.
25 жовтня, 4 місяці.
що дасть вам цей курс
Зазвичай математику у вузах викладають у відриві від реальних завдань, де вона надалі буде застосовуватися. Ми пішли іншим шляхом. Кожен модуль професійного курсу збалансований математичною теорією і практичними прикладами, які взяті з реальних кейсів. Ви будете вирішувати завдання регресії, проводити АБ-тестування, працювати над рекомендаційною системою, використовувати метод опорних векторів.
Для кого цей курс?
Курс підійде всім, хто хоче розвиватися в сфері Data Science. Він допоможе вам освоїти весь необхідний математичний апарат для вирішення завдань на позиції Middle/Senior Data Scientist.
Навіщо вчити математику?
Професія Data Scientist стає однією з найперспективніших і затребуваних в IT. Середня зарплата фахівців Data Science в Росії вдвічі вище, ніж у фахівців інших IT-напрямків — 190 тис.руб. основна складність професії — високі вимоги до знань вищої математики. Впевнене володіння математичним апаратом дозволяє підвищити рівень компетенцій і вирости в професійному плані.
тривалість курсу: 132 академічних години
Модуль 1 Лінійна алгебра
1 Вступ 1.
Математика в
DataScience
розуміння, що бути успішним Datascientist без
знання математики, а головне без її розуміння,
неможливо.
План і структура цього курсу.
Знайомство з викладачем
Математика для Data
Science. Просунутий
курс
Best Practice з вивчення математичного апарату,
необхідного для успішної кар'єри В Data Science
2 Вступ 2.
Основні
терміни та
визначення
математичного
аналізу,
лінійної
алгебри і
теорії
ймовірностей
- Базові терміни матаналізу (межа,
безперервність функції, диференціал)
- Базові терміни лінійної алгебри (вектор,
матриця, її види, ранг, визначник)
- Базові терміни теорії ймовірності
(визначення ймовірності, мат.очікування,
дисперсія)
- Встановлення Python, надання рекомендацій
за інтерпретатором
- Обчислення базових завдань на Python за допомогою
стандартних пакетів
Домашні завдання
1 Основи лінійної алгебри, мат.аналізу і
теорії ймовірності
Мета: мета даної домашньої роботи-розвинути
практичні навички, отриманих в ході
першого і другого уроків.
Рекомендується спочатку пройти урок 1 і 2.
3 матриці.
Основні
поняття і
операції
ключові визначення, операція над матрицями,
визначник, зворотна матриця, обчислення
власних значень і власних векторів,
квадратичні форми
Домашні завдання
1 порахувати власні числа і
вектор.
4 геометрична
інтерпретація в
лінійної
алгебрі
- Геометрична інтерпретація матричних
перетворень
5 матричні
розкладання
1 розкласти матрицю в SVD.
Мета: для матриці A=[3 7] виконати
сингулярне розкладання в python з
використанням бібліотеки numpy (функція
linalg.svd). Записати отриману матрицю
перетворення. [5 2]
1. Встановити набір бібліотек Anaconda for
Python 3.7: https://www.anaconda.com/distribution/
2. Запустити графічне середовище Ipython
Notebook (написавши в терміналі ipython
notebook, або використовуючи графічний
інтерфейс Anaconda)
завдання
6 матричні
похідні
лінійної
алгебри в Data
Science.
Класифікація даних з SVM і Logistic Regression
Домашні завдання
1 повторити обчислення з заняття в Python на
інших даних.
8 застосування
лінійної
алгебри в
Machine
Learning
обробка зображень і лінійна алгебра
Модуль 2 Математичний аналіз
1 Теорія множин-імовірнісні простору. Дискретне
простір елементарних результатів
- Імовірність на числовій прямій і
площина. Правило додавання і множення
2 метричні
простору
метрики, приклади нормованих
простір.
- Норма в оптимізації
Домашні завдання
1 властивість метрики. Обчислити прості
операції над безліччю.
3 Теорія меж-визначення Коші.
Приватні похідні та диференціали
вищих порядків
— Градієнт. Матриця Гессе
Домашні завдання
1 обчислення похідних і меж
значень функції в нескінченності.
5 оптимізація-екстремуми функцій багатьох змінних
- Визначення точок локального і
глобальний мінімум. Необхідне і
достатня умова екстремуму для
опукла функція.
- Поняття стаціонарних точок і відмінність в їх
визначенні від точок екстремуму
6 мінімізація і
Максимізація в
Регресіях
1 максимізація функції з обмеженнями.
Мінімізація квадрата помилки.
7 інтегрування-невизначений інтеграл. Визначений
Інтеграл
- Додатки певного інтеграла і
наближені методи його обчислення
- Невласні інтеграли. Подвійні
інтеграли
- Наближені методи інтегрування
8 застосування
Мат.аналізу в ML
1 пошук екстремуму з
Python.
9 застосування
Мат.аналізу в ML
- Лінійна регресія та різні підходи до
оптимізації (градієнтний спуск, bounds, ітд.)
- Нелінійна регресія (реалізація на
нейронних мережах) і різні підходи до
оптимізації
10 MidTerm перевірочна робота.
В ході заняття буде надаватися від 2-х
до 5-ти хвилин на вирішення практичної
завдання. По закінченню відведеного часу
викладач вирішує завдання на екрані
Модуль 3 Теорія ймовірностей
1 комбінаторика
і основи
теорії
ймовірностей
- Принцип Діріхле. Переставляння. Розміщення.
Поєднання.
- Досвід і його результати. Простір елементарних
подія. Імовірність події.
- Незалежність подій. Умовна ймовірність.
Формули додавання і множення.
- Формули повної ймовірності і Байєса
2 випадкові
величини
Дискретні і безперервні розподілу
Домашні завдання
1 обчислити мат.очікування, написавши програмний
код в Python.
3 безперервні
випадкові
величини
- Основні закони розподілу та їх фізичний
зміст: біноміальне, пуассонівське,
експоненціальне, рівномірне, гауссовское
- Комп'ютерне моделювання різних
розподілів
4 теореми-випадкові послідовності і збіжність
1 Завдання на попередні теми курсу:
максимізувати функцію. Відносити
відносно середнього. Обчислити кількість
можливих повторень.
5 точкове і
інтервальне
оцінювання
- Асимптотична нормальність оцінок
— Довірчий інтервал. Принцип побудови
довірчих інтервалів
6 Перевірка
гіпотез
- Перевірка статистичних гіпотез. Формулювання
гіпотеза.
- Перевірка гіпотези про закон розподілу
вибірка. Критерій згоди Пірсона.
- Перевірка гіпотези про незалежність двох
номінальних ознак. Критерій хі-квадрат
7 Перевірка
гіпотеза. Частина 2
- Помилки I і II роду, рівень значущості.
Статистичний критерій. Побудова
довірчої та критичної областей. P-value
- Перевірка гіпотези про ймовірність успіху в схемі
Бернуллі. Біноміальний критерій
8 види
залежностей
- Види залежностей випадкових величин:
функціональна, причинно-наслідкова,
статистична, кореляційна. Відмінності та зв'язок
між ними.
Модуль 1 Лінійна алгебра
1 Вступ 1.
Математика в
DataScience
розуміння, що бути успішним Datascientist без
знання математики, а головне без її розуміння,
неможливо.
План і структура цього курсу.
Знайомство з викладачем
Математика для Data
Science. Просунутий
курс
Best Practice з вивчення математичного апарату,
необхідного для успішної кар'єри В Data Science
2 Вступ 2.
Основні
терміни та
визначення
математичного
аналізу,
лінійної
алгебри і
теорії
ймовірностей
- Базові терміни матаналізу (межа,
безперервність функції, диференціал)
- Базові терміни лінійної алгебри (вектор,
матриця, її види, ранг, визначник)
- Базові терміни теорії ймовірності
(визначення ймовірності, мат.очікування,
дисперсія)
- Встановлення Python, надання рекомендацій
за інтерпретатором
- Обчислення базових завдань на Python за допомогою
стандартних пакетів
Домашні завдання
1 Основи лінійної алгебри, мат.аналізу і
теорії ймовірності
Мета: мета даної домашньої роботи-розвинути
практичні навички, отриманих в ході
першого і другого уроків.
Рекомендується спочатку пройти урок 1 і 2.
3 матриці.
Основні
поняття і
операції
ключові визначення, операція над матрицями,
визначник, зворотна матриця, обчислення
власних значень і власних векторів,
квадратичні форми
Домашні завдання
1 порахувати власні числа і
вектор.
4 геометрична
інтерпретація в
лінійної
алгебрі
- Геометрична інтерпретація матричних
перетворень
- Правило Крамера
- Знакоопределенность матриці. Матриця
5 матричні
розкладання
- Розкладання SVD і ALS
- Невід'ємні розкладання
- Заповнення пропусків в матрицях
1 розкласти матрицю в SVD.
Мета: для матриці A=[3 7] виконати
сингулярне розкладання в python з
використанням бібліотеки numpy (функція
linalg.svd). Записати отриману матрицю
перетворення. [5 2]
1. Встановити набір бібліотек Anaconda for
Python 3.7: https://www.anaconda.com/distribution/
2. Запустити графічне середовище Ipython
Notebook (написавши в терміналі ipython
notebook, або використовуючи графічний
інтерфейс Anaconda)
- Відобразити код завдання в Ipython Notebook
- Надіслати посилання на репозиторій, в якому
завдання
6 матричні
похідні
- Матричні похідні
- Диференціальні рівняння в матрицях
лінійної
алгебри в Data
Science.
Класифікація даних з SVM і Logistic Regression
Домашні завдання
1 повторити обчислення з заняття в Python на
інших даних.
8 застосування
лінійної
алгебри в
Machine
Learning
обробка зображень і лінійна алгебра
Модуль 2 Математичний аналіз
1 Теорія множин-імовірнісні простору. Дискретне
простір елементарних результатів
- Імовірність на числовій прямій і
площина. Правило додавання і множення
2 метричні
простору
- Поняття метричного простору.
- Визначення нормованого
метрики, приклади нормованих
простір.
- Норма в оптимізації
Домашні завдання
1 властивість метрики. Обчислити прості
операції над безліччю.
3 Теорія меж-визначення Коші.
- Визначення Піано.
- Обчислення меж функцій.
- Асимптотичні функції.
- Еквівалентні функції.
- Оцінка складності функції
Приватні похідні та диференціали
вищих порядків
— Градієнт. Матриця Гессе
Домашні завдання
1 обчислення похідних і меж
значень функції в нескінченності.
5 оптимізація-екстремуми функцій багатьох змінних
- Визначення точок локального і
глобальний мінімум. Необхідне і
достатня умова екстремуму для
опукла функція.
- Поняття стаціонарних точок і відмінність в їх
визначенні від точок екстремуму
6 мінімізація і
Максимізація в
Регресіях
- МНК
- ММП
1 максимізація функції з обмеженнями.
Мінімізація квадрата помилки.
7 інтегрування-невизначений інтеграл. Визначений
Інтеграл
- Додатки певного інтеграла і
наближені методи його обчислення
- Невласні інтеграли. Подвійні
інтеграли
- Наближені методи інтегрування
8 застосування
Мат.аналізу в ML
- Покоординатний спуск
- Градієнтний спуск
- Адаптивні варіанти градієнтного спуску
- Ньютонівські методи, bfgs
1 пошук екстремуму з
Python.
9 застосування
Мат.аналізу в ML
- Лінійна регресія та різні підходи до
оптимізації (градієнтний спуск, bounds, ітд.)
- Нелінійна регресія (реалізація на
нейронних мережах) і різні підходи до
оптимізації
10 MidTerm перевірочна робота.
В ході заняття буде надаватися від 2-х
до 5-ти хвилин на вирішення практичної
завдання. По закінченню відведеного часу
викладач вирішує завдання на екрані
Модуль 3 Теорія ймовірностей
1 комбінаторика
і основи
теорії
ймовірностей
- Принцип Діріхле. Переставляння. Розміщення.
Поєднання.
- Досвід і його результати. Простір елементарних
подія. Імовірність події.
- Незалежність подій. Умовна ймовірність.
Формули додавання і множення.
- Формули повної ймовірності і Байєса
2 випадкові
величини
- Випадкова величина
- Дискретні і безперервні випадкові величини
- Закон розподілу випадкової величини і
Дискретні і безперервні розподілу
- Функція розподілу та її властивості
- Розподіл Бернуллі
- Біноміальний розподіл
- Моделювання на Python дискретне
Домашні завдання
1 обчислити мат.очікування, написавши програмний
код в Python.
3 безперервні
випадкові
величини
- Основні закони розподілу та їх фізичний
зміст: біноміальне, пуассонівське,
експоненціальне, рівномірне, гауссовское
- Комп'ютерне моделювання різних
розподілів
4 теореми-випадкові послідовності і збіжність
- Теорема Пуассона для схеми Бернуллі
- Закон великих чисел (Чебишева, Бернуллі,
- ЦПТ локальна, ЦПТ Ліндеберга, ЦПТ Ляпунова
- Точкові оцінки та їх властивості
1 Завдання на попередні теми курсу:
максимізувати функцію. Відносити
відносно середнього. Обчислити кількість
можливих повторень.
5 точкове і
інтервальне
оцінювання
- Асимптотична нормальність оцінок
— Довірчий інтервал. Принцип побудови
довірчих інтервалів
6 Перевірка
гіпотез
- Перевірка статистичних гіпотез. Формулювання
гіпотеза.
- Перевірка гіпотези про закон розподілу
вибірка. Критерій згоди Пірсона.
- Перевірка гіпотези про незалежність двох
номінальних ознак. Критерій хі-квадрат
7 Перевірка
гіпотеза. Частина 2
- Помилки I і II роду, рівень значущості.
Статистичний критерій. Побудова
довірчої та критичної областей. P-value
- Перевірка гіпотези про ймовірність успіху в схемі
Бернуллі. Біноміальний критерій
8 види
залежностей
- Види залежностей випадкових величин:
функціональна, причинно-наслідкова,
статистична, кореляційна. Відмінності та зв'язок
між ними.
https://privatelink.de/?https://otus.ru/lessons/math-ds-advanced/process/module1/