Компьютерное зрение — CV [Яндекс Практикум] [Антон Моргунов]
За 2 месяца освоите продвинутые подходы и архитектуры, чтобы решать самые востребованные задачи
1. Детекция объектов.
Введение и быстрый старт с сегментацией
Подготовка данных и обучение модели
Постобработка и улучшение результатов
Альтернативные архитектуры
3.Генерация изображений
Введение в генерацию изображений
Autoencoder и VAE
GAN
Диффузионные модели
Файн‑тюнинг и кастомизация diffusion‑моделей
4. Трансформеры и мультимодальные модели
Введение в Vision Transformers
Файн-тюнинг ViT и гибридные трансформеры
Мультимодальные модели
Текстово‑визуальный поиск и описание изображений
Визуальные вопросы и ответы
Автор: Антон Моргунов
Программный эксперт курса. Senior ML‑инженер в Базис Центре.
Цена: 60000 руб.
За 2 месяца освоите продвинутые подходы и архитектуры, чтобы решать самые востребованные задачи
- Программа 2025 года: лучшие практики, инструменты и технологии
- Детекция, сегментация, генерация и мультимодальные модели
- Архитектуры, лосс‑функции, метрики, принципы повышения качества
- Глубокое погружение в принципы работы моделей
- 4 проекта в портфолио и практика на реальных бизнес‑задачах
- Удостоверение о повышении квалификации
- Специалисты в области Data Science
Научитесь строить на модели на основе информации из изображений, освоите SOTA‑архитектуры и сможете применять CV для решения бизнес‑задач - DL- и ML‑инженеры
Разберёте способы работы с визуальными данным, изучите продвинутые архитектуры и узнаете на практике, как применять CV в ваших проектах - Разработчики
Поймёте принципы обработки визуальных данных, научитесь применять OpenCV и TensorFlow, сможете интегрировать CV в разработку
- Создавать решения для сегментации и детекции объектов
- Обучать и адаптировать генеративные модели под собственные задачи
- Работать с мультимодальными данными и архитектурами на их основе
- Разбираться в трансформерах для изображений: ViT
- Оценивать и интерпретировать работу CV‑моделей
1. Детекция объектов.
- Введение и быстрый старт с YOLOv8
- YOLO‑модель: подготовка данных и обучение
- Постобработка и визуализация результатов
- Aльтернативные архитектуры: SSD и Faster R‑CNN
Введение и быстрый старт с сегментацией
Подготовка данных и обучение модели
Постобработка и улучшение результатов
Альтернативные архитектуры
3.Генерация изображений
Введение в генерацию изображений
Autoencoder и VAE
GAN
Диффузионные модели
Файн‑тюнинг и кастомизация diffusion‑моделей
4. Трансформеры и мультимодальные модели
Введение в Vision Transformers
Файн-тюнинг ViT и гибридные трансформеры
Мультимодальные модели
Текстово‑визуальный поиск и описание изображений
Визуальные вопросы и ответы
Автор: Антон Моргунов
Программный эксперт курса. Senior ML‑инженер в Базис Центре.
Цена: 60000 руб.
https://practicum.yandex.ru/computer-vision/