Машинное обучение с несбалансированными данными
Изучите несколько методов устранения дисбаланса данных и повышения производительности ваших моделей машинного обучения.
Авторы: Соледад Галли
Последнее обновление: 11/2020
Субтитры: Русский, Английский [Автоматически созданные]
Язык: Английский
Чему вы научитесь
- Методы неполной выборки наугад
- Методы недостаточной выборки, которые сосредоточены на наблюдениях, которые сложнее классифицировать
- Методы недостаточной выборки, игнорирующие потенциально зашумленные наблюдения
- Методы избыточной выборки для увеличения количества наблюдений меньшинств
- Способы создания синтетических данных для увеличения примеров класса меньшинств
- SMOTE и его варианты
- Используйте методы ансамбля с методами выборки для повышения производительности модели.
- Наиболее подходящие метрики оценки для использования с несбалансированными наборами данных
Добро пожаловать в машинное обучение с несбалансированными наборами данных. В этом курсе вы изучите несколько методов, которые вы можете использовать с несбалансированными наборами данных, чтобы повысить производительность ваших моделей машинного обучения.
Если вы работаете с несбалансированными наборами данных прямо сейчас и хотите улучшить производительность своих моделей, или просто хотите узнать больше о том, как справиться с дисбалансом данных, этот курс покажет вам, как это сделать.
Мы шаг за шагом проведем вас через увлекательные видеоуроки и научим всему, что вам нужно знать о работе с несбалансированными наборами данных. На протяжении этого всеобъемлющего курса мы охватываем практически все доступные методики работы с несбалансированными наборами данных, обсуждая их логику, их реализацию на Python, их преимущества и недостатки, а также соображения, которые следует учитывать при использовании этой техники. В частности, вы узнаете:
- Методы неполной выборки случайным образом или с упором на выделение определенных групп выборки
- Методы случайной избыточной выборки и методы, создающие новые примеры на основе существующих наблюдений
- Методы ансамбля, которые используют возможности нескольких слабых учеников в сочетании с методами выборки для повышения производительности модели
- Чувствительные к стоимости методы, которые более серьезно наказывают за неправильные решения для представителей меньшинств
- Соответствующие метрики для оценки производительности модели на несбалансированных наборах данных
Этот всеобъемлющий курс машинного обучения включает более 50 лекций, охватывающих около 8 часов видео, и ВСЕ темы включают практические примеры кода Python, которые вы можете использовать для справки и для практики, а также повторно использовать в своих собственных проектах .
Материалы курса
10 разделов • 84 лекций • Общая продолжительность 6 ч 24 мин
Для кого этот курс:
- Специалисты по данным и инженеры по машинному обучению, работающие с несбалансированными наборами данных
https://www.udemy.com/course/machine-learning-with-imbalanced-data/