Machine Learning. Advanced (февраль 2026) [OTUS]
Продвинутые ML приемы для Data Scientists, желающих повысить свой профессиональный уровень до Middle+
Для кого этот курс?
Middle+/Senior Machine Learning Engineer (ML Engineer)
Начало 15 февраля 2026
Цена 109000 руб
Продвинутые ML приемы для Data Scientists, желающих повысить свой профессиональный уровень до Middle+
Для кого этот курс?
- Для аналитиков: научитесь применять методы машинного обучения в прогнозах
- Для программистов: научитесь строить end-to-end пайплайны и выводить ML-модели в production
- Для Специалистов в сфере Data Science и ML инженеров: усовершенствуйте навыки и продвигайтесь по карьерной лестнице
- Python (pandas, sklearn, numpy)
- Понимание базовых принципов и алгоритмов ML
- Математический анализ (вычисление производных сложных функций)
- Линейная алгебра (матричные операции и собственные вектора)
- Теория вероятностей и мат. статистики (понимание дисперсии, мат. ожидания, законы распределений).
- Вы изучите продвинутые методы машинного обучения, которые позволят вам уверенно себя чувствовать на ведущих Middle+ / Senior позициях и справляться с нестандартными задачами.
- После вебинара вы получаете Jupyter Notebook с разбором практического кейса с занятия. По итогу курса у вас будет обширная база знаний по каждому модулю.
- Настраивать окружение и писать production код, готовый к внедрению
- Работать с AutoML подходами и понимать ограничения в их применении
- Понимать и уметь применять Байесовские методы и обучение с подкреплением для соответствующих задач
- Решать сложные задачи, связанные с рекомендательными системами, временными рядами и RL, например: ранжирование, поиск одинаковых товаров, классификация изображений, динамическое ценообразования, оптимизация логистики, прогнозирование торговли и многие другие.
- Разрабатывать и создавать нейросетевые AI-модели.
- Применять широкий спектр нейросетевых AI-моделей для разнообразных задач.
Middle+/Senior Machine Learning Engineer (ML Engineer)
- Разработка, обучение и оптимизация ML-моделей
- Интеграция моделей в production-среду
- Работа с большими данными и feature engineering
- Решение сложных аналитических задач
- Построение и интерпретация ML-моделей
- A/B-тестирование и эксперименты
- У нас нет предзаписанных уроков.
- Занятия в OTUS – это вебинары.
- Преподаватели-практики помогут погрузиться в теорию, обучат на реальных примерах, расскажут о необходимых в работе инструментах.
- Вы всегда сможете задать вопрос и получить исчерпывающий ответ. И самое главное – сможете практиковаться.
- Учитесь онлайн отовсюду. А если вдруг пропустите занятие, просто посмотрите запись.
- Бонусный модуль NLP
- Бонусный модуль Графы
- Временные ряды
- Рекомендательные системы. Задача ранжирования
- Bayesian Learning, PyMC
- Reinforcement Learning
- Production
- Production. AutoML
- Проектная работа
Бонусный модуль NLP
Нейросетевые языковые модели и практические методы применения LLM и фундаментальных моделей.
Тема 1: Нейросетевые языковые модели и стратегии генерации текста
Тема 2: Машинный перевод и seq2seq
Тема 3: Архитектура Transformer и концепция attention mechanism
Тема 4: Transfer learning; BERT model
Тема 5: Генеративные языковые модели GPT3 и методы few, zero-shot learning
Тема 6: Towards ChatGPT
Тема 7: Теория промптинга LLM
Тема 8: Sentence-transformers
Тема 9: Langchain
Тема 10: RAG - генерация на основе базы знаний
Бонусный модуль Графы
В этом модуле мы научимся работать с новым типом данных - графами. Разберем самые широко используемые библиотеки: NetworkX, Stellar. Познакомимся с задачами Community Detection, Link Prediction и Node Classification.
Тема 1: Введение в графы: основные понятия. NetworkX, Stellar
Тема 2: Анализ графов и интерпретация. Community Detection
Тема 3: Link Prediction и Node Classification
Временные ряды
Данный модуль посвящен продвинутым методам работы с временными рядами. Мы разберём различные способы генерации признаков из временных рядов, а также две важные задачи, которые можно решать с таким типом данных: кластеризацию и сегментацию.
Тема 1: Извлечение признаков. Fourier и Wavelet transformation, Automatic Feature generation - tsfresh
Тема 2: Unsupervised подходы: Кластеризация временных рядов
Тема 3: Unsupervised подходы: Сегментация временных рядов
Тема 4: Прогнозирование временных рядов
Тема 5: Поиск аномалий во временных рядах
Рекомендательные системы. Задача ранжирования
В этом модуле мы будем работать с различными типами рекомендательных систем. Рассмотрим случаи явного (explicit) и неявного (implicit) фидбека, а также крайне важную для рекомендаций задачу ранжирования - learning to rank. Также мы научимся работать с одной из самых популярных питоновских библиотек для рекомендательных систем.
Тема 1: Введение в теорию рекомендательных систем и их практическое применение
Тема 2: Проблема холодного старта. Метод поиска ближайших соседей
Тема 3: SVD и ALS алгоритмы
Тема 4: Практическое занятие по рекомендательным системам. Двухуровневая модель
Тема 5: Обзор нейросетевых моделей
Bayesian Learning, PyMC
В этом модуле мы познакомимся с очень важным и полезным направлением работы с данными (и не только) - байесовским обучением. В отличие от привычных нам моделей, где мы зачастую получаем точечную оценку коэффициентов и точечные же предсказания, в байесовской парадигме мы будем работать с целыми вероятностными распределениями и получать гораздо более мощные инструменты для работы с вероятностями. Мы подробно изучим теоретическую основу байесовских методов, включая способы получения оценок распределений при помощи сэмплирования, разберём байесовский подход к АB-тестированию, а также обобщенные линейные модели (GLM), способные решать задачи регрессии и классификации.
Тема 1: Введение в вероятностное моделирование, апостериорные оценки, сэмплирование
Тема 2: Markov Chain Monte-Carlo (MCMC), Metropolis–Hastings
Тема 3: Байесовское АB-тестирование
Тема 4: Generalized linear model (GLM) - байесовские регрессии, вывод апостериорных оценок коэффициентов
Тема 5: Практическое занятие по GLM
Тема 6: Практическое занятие по логит-регрессии
Тема 7: Байесовская сеть доверия: практическое занятие
Reinforcement Learning
Обучение с подкреплением (RL) - одно из очень перспективных направлений машинного обучения, которое находит всё больше применений на практике. Мы начнём с изучения теоретических основ RL, рассмотрим способ проведения АБ-тестов с использованием многоруких бандитов, а также разберём самые популярные алгоритмы: Markov Decision Process, Value Iteration, Policy Iteration, Temporal Difference, SARSA и Q-learning. При этом большой упор делается на практическое применение этих методов для решения реальных задач.
Тема 1: Введение в обучение с подкреплением
Тема 2: Multi-armed bandits для оптимизации AB-тестирования, от теории - сразу в бой
Тема 3: Практическое занятие: Multi-armed bandits в ecommerce: search оптимизация
Тема 4: Markov Decision Process, Value function, Bellman equation
Тема 5: Value iteration, Policy iteration
Тема 6: Monte Carlo Methods
Тема 7: Temporal Difference (TD) и Q-learning
Тема 8: SARSA и Практическое занятие: финансовый кейс TD и Q-learning
Тема 9: Deep Q-Network (DQN) алгоритм
Тема 10: Deep Policy Gradient (PG) алгоритм
Тема 11: Actor-Critic алгоритм
Production
Модуль полностью посвящен внедрению ML-проектов в прод. Мы подробно разберём сериализацию моделей, создание API и контейнеризацию в Docker и Kubernetes.
Тема 1: Production Code проекта на примере задачи классификации/регрессии, Virtual environments, dependency management, pypi/gemfury
Тема 2: REST-архитектура: Flask API
Тема 3: Docker: Структура, применение, деплой
Тема 4: Сети и Docker compose
Тема 5: Практическое занятие по работе в проде: деплой докера в Yandex Cloud
Тема 6: Колоночные БД и объектные хранилища
Тема 7: Версионирование данных. DVC
Тема 8: Воспроизводимость и версионирование. MLFlow
Production. AutoML
В этом модуле мы научимся грамотно структурировать код production ML-проекта с использованием виртуальных оболочек и менеджеров зависимостей. Также мы познакомимся с продвинутыми методами оптимизации кода и новыми способами кодирования категориальных переменных. Мы научимся работать с самыми популярными библиотеками для AutoML, поймём их преимущества и недостатки, а также области применения на практике.
Тема 1: Практическое занятие - Оптимизация кода, parallelization, multiprocessing, ускорение pandas, Modin для Pandas
Тема 2: Advanced Data Preprocessing. Categorical Encodings
Тема 3: Featuretools - а вы что, за меня и признаки придумывать будете?
Тема 4: H2O и TPOT - а вы что, за меня и модели строить будете?
Тема 5: Поиск нечетких дублей
Тема 6: Практическое занятие - Построение end-to-end пайплайнов и сериализация моделей
Проектная работа
Заключительный месяц курса посвящен проектной работе. Свой проект — это то, над чем интересно поработать слушателю. То, что можно создать на основе знаний, полученных на курсе. При этом не обязательно закончить его за месяц. В процессе написания по проекту можно получить консультации преподавателей.
Тема 1: Выбор темы проекта
Тема 2: Предзащита проектных работ №1
Тема 3: Предзащита проектный работ №2
Тема 4: Защита проектных работ
Нейросетевые языковые модели и практические методы применения LLM и фундаментальных моделей.
Тема 1: Нейросетевые языковые модели и стратегии генерации текста
Тема 2: Машинный перевод и seq2seq
Тема 3: Архитектура Transformer и концепция attention mechanism
Тема 4: Transfer learning; BERT model
Тема 5: Генеративные языковые модели GPT3 и методы few, zero-shot learning
Тема 6: Towards ChatGPT
Тема 7: Теория промптинга LLM
Тема 8: Sentence-transformers
Тема 9: Langchain
Тема 10: RAG - генерация на основе базы знаний
Бонусный модуль Графы
В этом модуле мы научимся работать с новым типом данных - графами. Разберем самые широко используемые библиотеки: NetworkX, Stellar. Познакомимся с задачами Community Detection, Link Prediction и Node Classification.
Тема 1: Введение в графы: основные понятия. NetworkX, Stellar
Тема 2: Анализ графов и интерпретация. Community Detection
Тема 3: Link Prediction и Node Classification
Временные ряды
Данный модуль посвящен продвинутым методам работы с временными рядами. Мы разберём различные способы генерации признаков из временных рядов, а также две важные задачи, которые можно решать с таким типом данных: кластеризацию и сегментацию.
Тема 1: Извлечение признаков. Fourier и Wavelet transformation, Automatic Feature generation - tsfresh
Тема 2: Unsupervised подходы: Кластеризация временных рядов
Тема 3: Unsupervised подходы: Сегментация временных рядов
Тема 4: Прогнозирование временных рядов
Тема 5: Поиск аномалий во временных рядах
Рекомендательные системы. Задача ранжирования
В этом модуле мы будем работать с различными типами рекомендательных систем. Рассмотрим случаи явного (explicit) и неявного (implicit) фидбека, а также крайне важную для рекомендаций задачу ранжирования - learning to rank. Также мы научимся работать с одной из самых популярных питоновских библиотек для рекомендательных систем.
Тема 1: Введение в теорию рекомендательных систем и их практическое применение
Тема 2: Проблема холодного старта. Метод поиска ближайших соседей
Тема 3: SVD и ALS алгоритмы
Тема 4: Практическое занятие по рекомендательным системам. Двухуровневая модель
Тема 5: Обзор нейросетевых моделей
Bayesian Learning, PyMC
В этом модуле мы познакомимся с очень важным и полезным направлением работы с данными (и не только) - байесовским обучением. В отличие от привычных нам моделей, где мы зачастую получаем точечную оценку коэффициентов и точечные же предсказания, в байесовской парадигме мы будем работать с целыми вероятностными распределениями и получать гораздо более мощные инструменты для работы с вероятностями. Мы подробно изучим теоретическую основу байесовских методов, включая способы получения оценок распределений при помощи сэмплирования, разберём байесовский подход к АB-тестированию, а также обобщенные линейные модели (GLM), способные решать задачи регрессии и классификации.
Тема 1: Введение в вероятностное моделирование, апостериорные оценки, сэмплирование
Тема 2: Markov Chain Monte-Carlo (MCMC), Metropolis–Hastings
Тема 3: Байесовское АB-тестирование
Тема 4: Generalized linear model (GLM) - байесовские регрессии, вывод апостериорных оценок коэффициентов
Тема 5: Практическое занятие по GLM
Тема 6: Практическое занятие по логит-регрессии
Тема 7: Байесовская сеть доверия: практическое занятие
Reinforcement Learning
Обучение с подкреплением (RL) - одно из очень перспективных направлений машинного обучения, которое находит всё больше применений на практике. Мы начнём с изучения теоретических основ RL, рассмотрим способ проведения АБ-тестов с использованием многоруких бандитов, а также разберём самые популярные алгоритмы: Markov Decision Process, Value Iteration, Policy Iteration, Temporal Difference, SARSA и Q-learning. При этом большой упор делается на практическое применение этих методов для решения реальных задач.
Тема 1: Введение в обучение с подкреплением
Тема 2: Multi-armed bandits для оптимизации AB-тестирования, от теории - сразу в бой
Тема 3: Практическое занятие: Multi-armed bandits в ecommerce: search оптимизация
Тема 4: Markov Decision Process, Value function, Bellman equation
Тема 5: Value iteration, Policy iteration
Тема 6: Monte Carlo Methods
Тема 7: Temporal Difference (TD) и Q-learning
Тема 8: SARSA и Практическое занятие: финансовый кейс TD и Q-learning
Тема 9: Deep Q-Network (DQN) алгоритм
Тема 10: Deep Policy Gradient (PG) алгоритм
Тема 11: Actor-Critic алгоритм
Production
Модуль полностью посвящен внедрению ML-проектов в прод. Мы подробно разберём сериализацию моделей, создание API и контейнеризацию в Docker и Kubernetes.
Тема 1: Production Code проекта на примере задачи классификации/регрессии, Virtual environments, dependency management, pypi/gemfury
Тема 2: REST-архитектура: Flask API
Тема 3: Docker: Структура, применение, деплой
Тема 4: Сети и Docker compose
Тема 5: Практическое занятие по работе в проде: деплой докера в Yandex Cloud
Тема 6: Колоночные БД и объектные хранилища
Тема 7: Версионирование данных. DVC
Тема 8: Воспроизводимость и версионирование. MLFlow
Production. AutoML
В этом модуле мы научимся грамотно структурировать код production ML-проекта с использованием виртуальных оболочек и менеджеров зависимостей. Также мы познакомимся с продвинутыми методами оптимизации кода и новыми способами кодирования категориальных переменных. Мы научимся работать с самыми популярными библиотеками для AutoML, поймём их преимущества и недостатки, а также области применения на практике.
Тема 1: Практическое занятие - Оптимизация кода, parallelization, multiprocessing, ускорение pandas, Modin для Pandas
Тема 2: Advanced Data Preprocessing. Categorical Encodings
Тема 3: Featuretools - а вы что, за меня и признаки придумывать будете?
Тема 4: H2O и TPOT - а вы что, за меня и модели строить будете?
Тема 5: Поиск нечетких дублей
Тема 6: Практическое занятие - Построение end-to-end пайплайнов и сериализация моделей
Проектная работа
Заключительный месяц курса посвящен проектной работе. Свой проект — это то, над чем интересно поработать слушателю. То, что можно создать на основе знаний, полученных на курсе. При этом не обязательно закончить его за месяц. В процессе написания по проекту можно получить консультации преподавателей.
Тема 1: Выбор темы проекта
Тема 2: Предзащита проектных работ №1
Тема 3: Предзащита проектный работ №2
Тема 4: Защита проектных работ
Цена 109000 руб
https://otus.ru/lessons/advanced-ml/