Придбаний [Otus] Математика для Data Science. Просунутий курс. 2019 Жовтень (Петро Лук'янченко)

Gadzhi · Бер 31, 2022

початок занять
25 жовтня, 4 місяці.

що дасть вам цей курс

Зазвичай математику у вузах викладають у відриві від реальних завдань, де вона надалі буде застосовуватися. Ми пішли іншим шляхом. Кожен модуль професійного курсу збалансований математичною теорією і практичними прикладами, які взяті з реальних кейсів. Ви будете вирішувати завдання регресії, проводити АБ-тестування, працювати над рекомендаційною системою, використовувати метод опорних векторів.

Для кого цей курс?
Курс підійде всім, хто хоче розвиватися в сфері Data Science. Він допоможе вам освоїти весь необхідний математичний апарат для вирішення завдань на позиції Middle/Senior Data Scientist.

Навіщо вчити математику?
Професія Data Scientist стає однією з найперспективніших і затребуваних в IT. Середня зарплата фахівців Data Science в Росії вдвічі вище, ніж у фахівців інших IT-напрямків — 190 тис.руб. основна складність професії — високі вимоги до знань вищої математики. Впевнене володіння математичним апаратом дозволяє підвищити рівень компетенцій і вирости в професійному плані.

тривалість курсу: 132 академічних години

Модуль 1 Лінійна алгебра

1 Вступ 1.
Математика в
DataScience
розуміння, що бути успішним Datascientist без
знання математики, а головне без її розуміння,
неможливо.
План і структура цього курсу.
Знайомство з викладачем
Математика для Data
Science. Просунутий
курс
Best Practice з вивчення математичного апарату,
необхідного для успішної кар'єри В Data Science

2 Вступ 2.
Основні
терміни та
визначення
математичного
аналізу,
лінійної
алгебри і
теорії
ймовірностей
- Базові терміни матаналізу (межа,
безперервність функції, диференціал)
- Базові терміни лінійної алгебри (вектор,
матриця, її види, ранг, визначник)
- Базові терміни теорії ймовірності
(визначення ймовірності, мат.очікування,
дисперсія)
- Встановлення Python, надання рекомендацій
за інтерпретатором
- Обчислення базових завдань на Python за допомогою
стандартних пакетів
Домашні завдання
1 Основи лінійної алгебри, мат.аналізу і
теорії ймовірності
Мета: мета даної домашньої роботи-розвинути
практичні навички, отриманих в ході
першого і другого уроків.
Рекомендується спочатку пройти урок 1 і 2.

3 матриці.
Основні
поняття і
операції
ключові визначення, операція над матрицями,
визначник, зворотна матриця, обчислення
власних значень і власних векторів,
квадратичні форми
Домашні завдання
1 порахувати власні числа і
вектор.

4 геометрична
інтерпретація в
лінійної
алгебрі
- Геометрична інтерпретація матричних
перетворень

Правило Крамера
Знакоопределенность матриці. Матриця

Маркова. Жорданова форма

5 матричні
розкладання

Розкладання SVD і ALS
Невід'ємні розкладання
Заповнення пропусків в матрицях

Домашні завдання
1 розкласти матрицю в SVD.
Мета: для матриці A=[3 7] виконати
сингулярне розкладання в python з
використанням бібліотеки numpy (функція
linalg.svd). Записати отриману матрицю
перетворення. [5 2]
1. Встановити набір бібліотек Anaconda for
Python 3.7: https://www.anaconda.com/distribution/
2. Запустити графічне середовище Ipython
Notebook (написавши в терміналі ipython
notebook, або використовуючи графічний
інтерфейс Anaconda)

Відобразити код завдання в Ipython Notebook
Надіслати посилання на репозиторій, в якому

буде викладено Ipython Notebook з рішенням
завдання

6 матричні
похідні

Матричні похідні
Диференціальні рівняння в матрицях

7 застосування
лінійної
алгебри в Data
Science.
Класифікація даних з SVM і Logistic Regression
Домашні завдання
1 повторити обчислення з заняття в Python на
інших даних.

8 застосування
лінійної
алгебри в
Machine
Learning
обробка зображень і лінійна алгебра

Модуль 2 Математичний аналіз
1 Теорія множин-імовірнісні простору. Дискретне
простір елементарних результатів
- Імовірність на числовій прямій і
площина. Правило додавання і множення

2 метричні
простору

Поняття метричного простору.
Визначення нормованого

простору, поняття норми, відмінність від
метрики, приклади нормованих
простір.
- Норма в оптимізації
Домашні завдання
1 властивість метрики. Обчислити прості
операції над безліччю.

3 Теорія меж-визначення Коші.

Визначення Піано.
Обчислення меж функцій.
Асимптотичні функції.
Еквівалентні функції.
Оцінка складності функції

4 диференціювання-диференційованість функції в точці
Приватні похідні та диференціали
вищих порядків
— Градієнт. Матриця Гессе
Домашні завдання
1 обчислення похідних і меж
значень функції в нескінченності.

5 оптимізація-екстремуми функцій багатьох змінних
- Визначення точок локального і
глобальний мінімум. Необхідне і
достатня умова екстремуму для
опукла функція.
- Поняття стаціонарних точок і відмінність в їх
визначенні від точок екстремуму

6 мінімізація і
Максимізація в
Регресіях

МНК
ММП

Домашні завдання
1 максимізація функції з обмеженнями.
Мінімізація квадрата помилки.

7 інтегрування-невизначений інтеграл. Визначений
Інтеграл
- Додатки певного інтеграла і
наближені методи його обчислення
- Невласні інтеграли. Подвійні
інтеграли
- Наближені методи інтегрування

8 застосування
Мат.аналізу в ML

Покоординатний спуск
Градієнтний спуск
Адаптивні варіанти градієнтного спуску
Ньютонівські методи, bfgs

Домашні завдання
1 пошук екстремуму з
Python.

9 застосування
Мат.аналізу в ML
- Лінійна регресія та різні підходи до
оптимізації (градієнтний спуск, bounds, ітд.)
- Нелінійна регресія (реалізація на
нейронних мережах) і різні підходи до
оптимізації
10 MidTerm перевірочна робота.
В ході заняття буде надаватися від 2-х
до 5-ти хвилин на вирішення практичної
завдання. По закінченню відведеного часу
викладач вирішує завдання на екрані

Модуль 3 Теорія ймовірностей
1 комбінаторика
і основи
теорії
ймовірностей
- Принцип Діріхле. Переставляння. Розміщення.
Поєднання.
- Досвід і його результати. Простір елементарних
подія. Імовірність події.
- Незалежність подій. Умовна ймовірність.
Формули додавання і множення.
- Формули повної ймовірності і Байєса

2 випадкові
величини

Випадкова величина
Дискретні і безперервні випадкові величини
Закон розподілу випадкової величини і

способи його опису
Дискретні і безперервні розподілу

Функція розподілу та її властивості
Розподіл Бернуллі
Біноміальний розподіл
Моделювання на Python дискретне

розподіл (для завдання МонтеКарло)
Домашні завдання
1 обчислити мат.очікування, написавши програмний
код в Python.

3 безперервні
випадкові
величини
- Основні закони розподілу та їх фізичний
зміст: біноміальне, пуассонівське,
експоненціальне, рівномірне, гауссовское
- Комп'ютерне моделювання різних
розподілів

4 теореми-випадкові послідовності і збіжність

Теорема Пуассона для схеми Бернуллі
Закон великих чисел (Чебишева, Бернуллі,

Хінчіна)

ЦПТ локальна, ЦПТ Ліндеберга, ЦПТ Ляпунова
Точкові оцінки та їх властивості

Домашні завдання
1 Завдання на попередні теми курсу:
максимізувати функцію. Відносити
відносно середнього. Обчислити кількість
можливих повторень.

5 точкове і
інтервальне
оцінювання
- Асимптотична нормальність оцінок
— Довірчий інтервал. Принцип побудови
довірчих інтервалів

6 Перевірка
гіпотез
- Перевірка статистичних гіпотез. Формулювання
гіпотеза.
- Перевірка гіпотези про закон розподілу
вибірка. Критерій згоди Пірсона.
- Перевірка гіпотези про незалежність двох
номінальних ознак. Критерій хі-квадрат

7 Перевірка
гіпотеза. Частина 2
- Помилки I і II роду, рівень значущості.
Статистичний критерій. Побудова
довірчої та критичної областей. P-value
- Перевірка гіпотези про ймовірність успіху в схемі
Бернуллі. Біноміальний критерій

8 види
залежностей
- Види залежностей випадкових величин:
функціональна, причинно-наслідкова,
статистична, кореляційна. Відмінності та зв'язок
між ними.
https://privatelink.de/?https://otus.ru/lessons/math-ds-advanced/process/module1/

Пошук

Пошук

Придбаний [Otus] Математика для Data Science. Просунутий курс. 2019 Жовтень (Петро Лук'янченко)

Gadzhi

Модератор