Data Scientist [2021]
TeachMeSkills
Богдан
Научим Data Science с нуля за 7,5 месяцев.
Кем ты станешь:
С развитием технологий и повсеместным использованием гаджетов все легче становится собирать различные данные о том, что происходит в мире — от наших кликов в интернет-пространстве до структуры развития человеческого генома. Для того, чтобы уметь обращаться с этими данными, и существует Data Science. Какую песню предложить тебе для прослушивания? Как определить, где пешеход, а где встречная машина во время движения? Как спрогнозировать изменение цен на криптовалюту в будущем? На этом курсе ты сможешь понять, как работают все вышеперечисленные алгоритмы, а также научишься строить свои предиктивные модели, используя фреймворки TensorFlow и PyTorch.
Твой результат в конце курса:
- Выучишь основные алгоритмы машинного обучения и натренируешь свои модели
- Построишь и обучишь глубокие нейронные сети, определишь архитектурные параметры
- Используешь лучшие методики для оценки качества моделей и их оптимизации
- Научишься стратегиям end-to-end, транcфера и многозадачного машинного обучения
- Построишь сверточные и рекурентные нейронные сети, используя фреймворки PyTorch и TensorFlow
- Станешь востребованным специалистом в сфере Data Science
Модуль 1 - Введение
Модуль 58 - Подготовка к техническому собеседованию
Модуль 59 - Онлайн-тренинг "Трудоустройство в IT"
- Краткий обзор курса и задач Machine Learning
- Что такое Machine Learning, Data Science, AI
- Google Colab, Jupyter Notebook, настройка среды
- Введение в Python
- Основы работы с Python
- Git - введение
- Git Flow
- Git - практика
- Операторы, выражения
- Числа с плавающей точкой (int/float)
- float 2
- Базовые коллекции 1 - list (списки)
- Базовые коллекции: cтроки
- Базовые коллекции: словари и множества
- Базовые коллекции: кортежи
- Условный оператор if, ветвления
- Условный оператор if: продолжение
- Цикл while
- For: циклы со счетчиком
- For: циклы со счетчиком, часть 2. Функция range
- Цикл for: работа со строками
- Вложенные циклы
- Функции
- Методы для работы со списком
- List comprehensions
- Функции — Рекурсия
- Классы
- Изучить основные методы и структуры данных библиотеки Pandas
- Извлечение данных, визуализация результатов
- Группировка, подсчет метрик
- Преобразование данных
- Базы данных
- SQLite
- SQL запросы
- ORM
- Сложные запросы
- PostgreSQL
- SQLAlchemy
- Функции и триггеры
- ORM
- Линейная алгебра (Основы матричного исчисления), векторы, векторное пространство
- Вычисления с помощью NumPy
- Матрицы. Реализация матричных операций на языке Python
- Основы теории вероятности и математической статистики. Основы мат. анализа
- Распределения, доверительные интервалы
- Корреляция
- Базовый эксплоративный анализ и визуализация данных
- Работа с данными в Pandas
- Визуализация данных в Matplotlib
- Plotly
- Обучение с учителем/без учителя/с подкреплением
- Функция ошибок
- Градиентный спуск
- Линейная регрессия
- Множественная линейная регрессия
- Классификация (логистическая регрессия)
- Переобучение (регуляризация)
- Недообучение
- Другие алгоритмы (Метод опорных векторов)
- Понятие нейронных сетей. Нейрон. Многослойный персептрон
- Функции активации
- Learning (Forward, Backpropagation)
- Смещение/разброс (Bias/Variance)
- Кривые обучения (Learning curves)
- Метрики оценки
- Деревья решений
- Ансамблевые методы Boosting/Bagging
- Градиентный бустинг
- Random Forest
- Метод k-средних
- Иерархическая кластеризация
- DBSCAN
- Выявление аномалий
- Метод главных компонент (PCA)
- Стохастическое вложение соседей с t-распределением (T-SNE)
- Основанная на пользователях
- Основанная на контенте
- Коллаборационный фильтр
- Модели прогнозирования временных рядов
- Large scale algo
- Batching
- Cross-Validation
- Map reduce
- Классификация архитектур нейронных сетей
- Виды слоёв (и классификация нейронов)
- Обучение: функция потерь, обратное распространение ошибки, оптимизаторы, стохастический градиент
- Регуляризация
- Ознакомление с библиотеками для Deep Learning
- Улучшаем глубокие нейросети
- Оптимизация гиперпараметров, Регуляризция и Оптимизация
- Gradient vanishing/explosion
- Structuring Machine Learning Projects
- Transfer Learning
- Введение
- Операция свертки
- Слои в сверточных нейросетях
- Базовая структура сверточной нейросети
- Классификация объектов
- Object detection
- Распознавание лиц
- Перенос стилей
- Рекуррентная нейросеть (RNN)
- Управляемый рекуррентный блок (GRU)
- Долгая краткосрочная память (LSTM)
- Двунаправленная RNN/LSTM
- Механизм внимания
- Word2Vec, GloVe и Fastext
- BERT
- Классические подходы применения статистики
- Предобработка временных рядов
- Применение Deep Learning
- Сегментация объектов на изображении
- Анализ эмоциональной окрашенности текста
- Классификации текста
- Основы Computer Science (OOП)
- Базовые алгоритмы и структуры данных
- Инкапсуляция, наследование и полиморфизм
- Перегрузка операторов
- MRO
- Статические методы, методы класса, property
- Метаклассы
- Классы данных
- Flask or Fast API
- Знакомство с AWS
- Базы данных на AWS -- RedShift
- AWS SageMaker, S3
- AWS Textract
- Google Cloud Platform
- Google Vision
- Деплой своего проекта на GCP (App Engine)
Модуль 58 - Подготовка к техническому собеседованию
Модуль 59 - Онлайн-тренинг "Трудоустройство в IT"
- Составление резюме (теория + практика)
- Составление профиля на LinkedIn (теория + практика)
- Прохождение интервью
- Soft skills, которые важны в рамках интервью
- Проведение пробного интервью
https://teachmeskills.by/kursy-programmirovaniya/data-scientist-online