Искусственный интеллект: обучение с подкреплением на Python
Автор: Lazy Programmer Inc.
Формат: транскрибация видео
Продолжительность: ~ 8.5 ч
Перевод: Красный Кут
Тип перевода: Транскрибация с русским переводом
Дата выдачи курса 18.01.20
Демо перевод
Решил сделать перевод всех курсов Lazy Programmer Inc. о искусственном интеллекте, машинном обучении,- взяв за основу материалы из этой .
Другие курсы автора смотрите у меня в подписи
ЧЕМУ ВЫ НАУЧИТЕСЬ?
Спойлер
– применять градиент-ориентированное машинное обучение с учителем для обучения с подкреплением;
– понимать обучение с подкреплением на техническом уровне;
– понимать связь между обучением с подкреплением и психологией;
- реализовывать 17 различных алгоритмов обучения с подкреплением
ТРЕБОВАНИЯ
Спойлер
– дифференциальное счисление;
– теория вероятностей;
– марковские модели;
– инструментарий Numpy;
– опыт работы с хотя бы несколькими методами машинного обучения с учителем;
– градиентный спуск;
– хорошие навыки в объектно-ориентированном программировании.
– дифференциальное счисление;
– теория вероятностей;
– объектно-ориентированное программирование;
– написание кода на Python: условный оператор, операторы цикла, списки, словари, наборы;
– написание кода в Numpy: матричные и векторные операции;
– линейная регрессия;
– градиентный спуск.
ОПИСАНИЕ
Спойлер
Когда говорят об искусственном интеллекте, то обычно не подразумевают машинное обучение с учителем или без него – решаемые ими задачи кажутся тривиальными, по сравнению с тем, что делает ИИ, - играет в шахматы и го, водит машины, проходит видеоигры на сверхсложном уровне.
Обучение с подкреплением стало в последнее время популярным как для этих целей, так и для многого другого. Во многом подобно глубокому обучению, значительная часть теоретических основ была исследована в 70-х и 80-х годах, но до недавнего времени мы не имели возможности воочию наблюдать те удивительные результаты, на которые способно обучение с подкреплением.
В 2016 году мы увидели, как Google AlphaGo победила чемпиона по игре в го. Мы увидели, как ИИ играет в видеоигры вроде Doom и SuperMario. Самодвижущиеся автомобили начали ездить по настоящим дорогам без водителей и даже перевозить пассажиров (как Uber), и всё это – без помощи человека. И если это уже кажется удивительным, то приготовьтесь – закон ускорения отдачи гласит, что это развитие будет только расти по экспоненте.
Овладение машинным обучением с учителем и без – это не такое и маленькое достижение. Так, на сегодняшний день у меня уже более ШЕСТНАДЦАТИ (16!) курсов, посвящённым только этой тематике.
И всё же обучение с подкреплением открывает перед нами целый новый мир. При прохождении курса вы узнаете, что парадигма обучения с подкреплением в большей степени отличается от обучения с учителем и без учителя, чем они сами друг от друга.
Это привело к новому и удивительному пониманию как поведенческой психологии, так и нейробиологии. Как вы узнаете из этого курса, существует много аналогичных процессов, когда речь заходит об обучении агента, животного или даже человека. Пока что это – ближайшее к настоящему общему искусственному интеллекту.
Что охватывает этот курс?
– проблема многорукого бандита и дилемма исследования и использования;
– способы расчёта средних и скользящих средних, а также их взаимосвязь со стохастическим градиентным спуском;
– марковские процессы принятия решений;
– динамическое программирование;
– метод Монте-Карло;
– метод временных различий.
– методы аппроксимации (т. е. как подключить глубокую нейронную сеть или другую дифференцируемую модель к алгоритму обучения с подкреплением).
Если вы готовы принять совершенно новый вызов и изучить ранее невиданные в традиционном машинном обучении с учителем и без, или даже в глубоком обучении методы ИИ – этот курс для вас.
До встречи на занятиях!
Скрытое содержимое.
https://www.udemy.com/artificial-intelligence-reinforcement-learning-in-python/