Современное компьютерное зрение [stepik] [AI Education] [Елена Кантонистова, Марк Блуменау, Евгений Паточенко, Илья Никитин]
Курс посвящен основам глубинного обучения в области Computer Vision (CV). В курсе мы начнем с азов компьютерного зрения, а затем затронем актуальные задачи CV и посмотрим на устройство популярных решений.
Программа курса
Классические методы Computer Vision
Курс посвящен основам глубинного обучения в области Computer Vision (CV). В курсе мы начнем с азов компьютерного зрения, а затем затронем актуальные задачи CV и посмотрим на устройство популярных решений.
Программа курса
Классические методы Computer Vision
- Демо-доступ
- Демо-доступ
- Демо-доступ
- Методы выделения признаков: SIFT и другие
- HOG: гистограммы направленных градиентов
- Поиск и сопоставление ключевых точек
- Преобразование Хафа и обнаружение геометрических фигур
- Пространственные преобразования: аффинные и перспективные
- Основы сверточных нейронных сетей: ядра, фильтры, пуллинги
- Архитектура LeNet: первые шаги в CV с использованием CNN
- AlexNet: особенности и влияние на развитие глубокого обучения
- VGG: глубокие сети с фиксированными свертками
- ResNet: идея резидуальных связей для решения проблемы исчезающих
- Домашнее задание
- ViT (Vision Transformer): альтернатива CNN
- MobileNet: легковесные модели для мобильных устройств
- EfficientNet и EfficientNetV2: масштабируемость и оптимизация
- Практика: аугментации и MBConv
- Домашнее задание
- Основы задачи детекции и Non-Maximum Suppression
- RCNN: архитектура и эволюция (Fast RCNN, Faster RCNN)
- YOLOv1
- Современные подходы к детекции: YOLO11 и более новые версии
- Детекция на практике
- Домашнее задание
- Задача сегментации
- U-Net: идея и применение в медицинских изображениях
- Deeplab и его разновидности: адаптация к различным уровням разре
- Mask R-CNN: объединение детекции и сегментации
- Segment Anything Model (SAM): универсальная модель сегментации
- Практика по сегментации
- Домашнее задание (тестирование)
- Задача трекинга и оценивание качества трекинга
- Алгоритм трекинга
- Работа с видеопотоками. FFMpeg: чтение, запись, сжатие видео
- Gstreamer: организация сложных видео- и аудиопайплайнов
- Практика: захват видео с камер в реальном времени
- Тест по последнему занятию
- Итоговый проект курса
- Установка библиотеки. Загрузка и вывод изображений
- Аннотации типов в Python
- Практика с FastAPI
- Библиотека Pydantic
https://stepik.org/course/223852/promo