Що нового?

Придбаний [МФТІ] просунуті методи машинного навчання 2021 (Олег Івченко)

Інформація про покупку
Тип покупки: Складчина
Ціна: 56250 ГРН
Учасників: 0 з 5
Організатор: Відсутній
Статус: Набір учасників
Внесок: 11700 ГРН
0%
Основний список
Резервний список

Gadzhi

Модератор


Програма професійної перепідготовки.

програма професійної перепідготовки включає три курси:

  1. Аналіз зображень
  2. Аналіз текстів
  3. Машинне навчання на великих обсягах даних.
Блок 1 - Аналіз зображень
Модуль 1-Вступ до аналізу зображень. Основи обробки зображень
1.1. Введення в аналіз зображень.

  • Завдання комп'ютерного зору-метричний і семантичний зір.
  • виникають труднощі і візуальні підказки.
  • приклади сучасних систем і алгоритмів комп'ютерного зору.
  • пристрій камери і оптичної системи людини.
  • моделі кольору.
1.2 основи обробки зображень (частина 1)
  • основні завдання обробки зображень.
  • корекція кольору зображень. Гістограми, лінійна і нелінійна корекції яскравості. Моделі камери і кольорокорекції.
  • види шуму. Операція згортки. Фільтр гаусса, медіанний фільтр, підвищення різкості. Вирівнювання освітленості-алгоритм Retinex. Метрика PSNR.
  • виділення країв, алгоритм Canny.
1.3. Основи обробки зображень (частина 2)
  • частотне представлення зображень, частотна фільтрація зображень, алгоритм JPEG. Проста сегментація зображень-бінаризація, виділення пов'язаних компонент, математична морфологія.
  • поняття текстури.
  • евристичні методи розпізнавання за допомогою ознак сегментів.
Модуль 2 - виділення базових об'єктів на зображеннях. Геометричні моделі відображення зображень
2.1. Локальні особливості зображень

  • Завдання зіставлення зображень. Поняття локальної особливості.
  • Детектори Харріса, LoG, DOG, Harris-Laplacian.
  • зіставлення особливостей за дескрипторами - метод SIFT, афінна адаптація.
2.2. Оцінка параметрів моделей
  • задачі оцінки параметрів геометричних моделей.
  • DLT-метод для ліній і перетворень.
  • Робастні алгоритми-м-оцінки, стохастичні алгоритми, схеми голосування. Застосування для побудови панорам і пошуку об'єктів.
Модуль 3-Основи машинного навчання. Виявлення об'єктів
3.1. Категоризація зображень

  • поняття категорії.
  • розпізнавання категорій людиною.
  • Загальна схема категоризації зображень. Ознак. Гістограми ознак, піраміди. Візуальні слова і"мішок слів".
3.2. Виділення категорій на зображеннях
  • Завдання виділення категорій об'єктів на зображенні. Ковзне вікно. Застосування "мішка слів" для виділення об'єктів.
  • Метод HOG + SVM, розмноження вибірки та завантаження.
  • методи на основі слабких класифікаторів. Алгоритм пошуку осіб Viola-Jones, ознаки Хоара, інтегральні зображення.
  • шляхи розвитку детекторів та сучасний стан
3.3. Пошук зображень за змістом
  • варіанти постановки задачі - пошук напівдублікатів, пошук схожих, пошук по класах. Пошук на основі кольорових гістограм (QBIC).
  • Дескриптор GIST.
  • пошук напівдублікатів-наближені методи найближчого сусіда, інвертований Індекс, хешування.
  • пошук на основі "мішка слів", зворотний Індекс, використання просторової інформації для підвищення точності.
Модуль 4 - нейромережеві підходи до аналізу зображень. Основні завдання та алгоритми
4.1. Інтернет-зір

  • великі колекції зображень і методи їх складання.
  • Доповнення зображень (Image completion) за допомогою великих колекцій. Класифікація зображень за допомогою великих колекцій.
  • фотоколажі. Shape context. Об'єктні фільтри.
4.2.. Оптичний потік і віднімання фону
  • введення в обробку та аналіз відео.
  • поняття оптичного потоку. Глобальні та локальні (Lucas-Kanade) методи оцінки оптичного потоку.
  • віднімання фону (BS - background subtraction). Алгоритми BS: одна гауссіана, суміш гауссіан, поблочні методи, об'єднання локальних і глобальних колірних моделей.
4.3. Супровід об'єктів і розпізнавання подій у відео
  • Завдання супроводу об'єктів у відео, постановки, критерії якості та проблеми.
  • супровід одного об'єкта - зіставлення шаблонів, на основі Chamfer-метрики, MeanShift, Flock of features, комбінації методів.
  • супровід безлічі об'єктів - супровід через зіставлення.
  • розпізнавання подій у відео, тестові бази, автоматична розмітка відео. Методи розпізнавання-дескриптори на основі оптичного потоку, локальні особливості, Класифікація, прицілювання.
4.4. Комп'ютерний зір реального часу
  • алгоритми доповненої реальності, вимоги до них.
  • вирішальний ліс як один з базових методів для доповненої реальності.
  • реєстрація зображень в реальному часі.
  • система Kinect і оцінка пози людини в реальному часі.
Блок 2 - аналіз текстів
Модуль 1

  • Intro to NLP
Модуль 2
  • Lecture: Word embeddings
  • Distributional semantics. Count-based (pre-neural) methods. Word2Vec: learn vectors. GloVe: count, then learn. N-gram (collocations) RusVectores. t-SNE.
  • Practical: word2vec, fasttext
Модуль 3
  • Lecture: RNN + CNN, Text classification
  • Neural Language Models: Recurrent Models, Convolutional Models. Text classification (architectures)
  • Practical: Classification with LSTM, CNN
Модуль 4
  • Lecture: Language modelling and NER
  • Task description, methods (Markov Model, RNNs), evaluation (perplexity), Sequence Labelling (NER, pos-tagging, chunking etc.) N-gram language models, HMM, MEMM, CRF
  • Practical: NER
Модуль 5
  • Lecture: Machine translation, Seq2seq, Attention, Transformers
  • Basics: Encoder-Decoder framework, Inference (e.g., beam search), Eval (bleu). Attention: general, score functions, models. Bahdanau and Luong models. Transformer: self-attention, masked self-attention, multi-head attention.
Модуль 6
  • Lecture: Transfer learning in NLP
  • Bertology (BERT, GPT-s, t5, etc.), Subword Segmentation (BPE), Evaluation of big LMs.
  • Practical: transformers models for classification task,
  • Practical: Transfer learning
Модуль 7
  • Lecture & Practical: How to train big models? Part1. Distributed training, Part2. RuGPT3 Training
  • Training Multi-Billion Parameter Language Models. Model Parallelism. Data Parallelism.
  • Practical: DDP example
Модуль 8
  • Lecture: Syntax parsing
  • Practical: Syntax
Модуль 9
  • Lecture: Question answering
  • Practical: seminar QA, seminar chatbots
  • Squads (one-hop, multi-hop), architectures, retrieval and search, chat-bots
Модуль 10
  • Lecture: Summarization, simplification, paraphrasing
  • Practical: summarization seminar
Модуль 11
  • Lecture: Knowledge Distillation in NLP
Блок 3-Машинне навчання на великих обсягах даних
Модуль 1 - методи оптимізації та лінійні моделі

  • Машинне навчання з учителем на великих даних.
  • Закон Ципфа.
  • тематичне моделювання.
  • Метод стохастичного градієнта.
  • Постановка задачі.
  • оптимізації навчання на великих даних: градієнтний спуск, стохастичний градієнт.
  • ознаки.
  • простору ознак, ваги ознак, нормалізація ознак.
  • генерація та хешування ознак.
  • Онлайн навчання лінійних моделей.
  • Метод стохастичного градієнта: вибір функції втрат.
  • оцінка якості методу стохастичного градієнта.
  • Алгоритм Бутстрап.
  • хешування, чутливе до відстані (LSH).
  • заходи подібності: відстань Жаккара, Хеммінга, косинусна відстань, евклідова відстань.
  • оптимізація та тестування гіперпараметрів.
  • Симплекс-метод.
Модуль 2 - алгоритми роботи з графами великого розміру
  • графи, їх види.
  • стохастичний граф.
  • представлення графа: матриці суміжності, інцидентності, досяжності.
  • Списки суміжності.
  • алгоритми перекладу з одного подання в інше.
  • соціальний граф.
  • Завдання пошуку спільних друзів в соціальному графі.
  • мова DSL.
  • Граф користувальницьких переваг.
  • Використання підходу BigData в аналізі графіків.
Модуль 3 - інформаційний пошук
  • Постановка ранжирування.
  • основні підходи до вирішення завдання ранжирування.
  • Метрики вимірювання точності ранжування.
  • Клікові моделі.
  • тематичне моделювання та його зв'язок з ранжуванням.
  • проблеми тематичного моделювання при великих даних.
  • AD-LDA, його недоліки, Y!LDA, Mr. LDA. ARTM.
  • Архітектура бібліотеки BigARTM.
  • Online LDA і його застосування в Vowpal Wabbit.
Модуль 4 - рекомендаційні системи
  • рекомендаційні системи, постановка задачі передбачення/рекомендації.
  • Класифікація рекомендаційних систем.
  • Неперсоналізовані рекомендаційні системи, content-based рекомендаційні системи.
  • Завдання колаборативної фільтрації, транзакційні дані та матриця суб'єкти—об'єкти.
  • кореляційні методи, методи подібності (neighbourhood) - user-based, item-based.
  • латентні методи на основі матричних розкладів.
  • методи ALS та iALS.
    https://privatelink.de/?https://fpmi-edu.ru/dpo-magistr/machinelearning
 
Угорі