Що нового?

Набір учасників Навчання з підкріпленням для реальних завдань (Філ Віндер)

Інформація про покупку
Тип покупки: Складчина
Ціна: 328 ГРН
Учасників: 0 з 10
Організатор: Відсутній
Статус: Набір учасників
Внесок: 34.1 ГРН
0%
Основний список
Резервний список

Gadzhi

Модератор

Переглянути вкладення 77768



навчання з підкріпленням для реальних завдань (Філ Віндер)
Книга присвячена промислово-орієнтованому застосуванню навчання з підкріпленням (Reinforcement Learning, RL). Пояснено, як навчати промислові та наукові системи вирішенню будь – яких покрокових задач методом проб і помилок-без підготовки вузькоспеціалізованих навчальних множин даних і без ризику перенавчити або переускладнити алгоритм. Розглянуто марківські процеси прийняття рішень, глибокі Q-мережі, градієнти політик та їх обчислення, методи усунення ентропії та багато іншого. Дана книга-перша російською мовою, де теоретичний базис RL і алгоритми дані в прикладному, галузевому Ключі.

Для аналітиків даних і фахівців зі штучного інтелекту.

Перша КНИГА російською мовою, де теоретичний базис RL і алгоритми дані в прикладному, галузевому Ключі!

З передмови.
Навчання з підкріпленням (Reinforcement learning, RL) — це парадигма машинного навчання (machine learning, ML), яка здатна оптимізувати послідовні рішення. RL цікавий тим, що імітує те, як ми, люди, вчимося. Ми інстинктивно здатні вивчати стратегії, які допомагають нам справлятися зі складними завданнями, такими як їзда на велосипеді або складання іспиту з математики. RL намагається скопіювати цей процес, взаємодіючи з навколишнім середовищем для вивчення стратегій.
Останнім часом компанії застосовують алгоритми машинного навчання для прийняття одноразових рішень. Вони навчаються на даних, щоб прийняти найкраще на поточний момент рішення. Однак часто правильне на даний момент рішення може бути не найкращим рішенням у довгостроковій перспективі. Так, повна ванна морозива зробить вас щасливими в короткостроковій перспективі, але наступного тижня вам доведеться пропадати в тренажерному залі. Подібним чином, рекомендації щодо клікбейту можуть дати найвищу клікабельність, але в довгостроковій перспективі такі статті сприймаються як шахрайство та завдають шкоди довгостроковому залученню чи утриманню читача.
RL цікаво тим, що дозволяє вивчити довгострокові стратегії і застосувати їх до складних промислових завдань. Як компанії, так і фахівці-практики можуть переслідувати цілі, які безпосередньо пов'язані з бізнесом, такі як отримання прибутку, нарощування кількості користувачів і їх утримання, а не технічні показники оцінки, такі як точність або f-міра. Простіше кажучи, вирішення багатьох проблем залежить від послідовного прийняття рішень. ML не призначений для вирішення цих проблем, RL-призначений.

Мета цієї книги-сприяти використанню RL у виробничих системах.
Якщо ви (зараз або в майбутньому) створюєте продукти в області RL, будь то дослідження, розробки або прикладні речі, то ця книга для вас. Це також означає, що я написав книгу більше для практиків, ніж для людей з академічних кіл.

Формат: PDF

https://privatelink.de/?https://linuxcenter.shop/product/kniga-buinder-fil-obuchenie-s-podkrepleniem-dlya-realnyh-zadach
 
Угорі