Глубокое обучение с подкреплением: теория и практика на языке Python
Глубокое обучение с подкреплением (глубокое RL) сочетает в себе два подхода к машинному обучению. В ходе такого обучения виртуальные агенты учатся решать последовательные задачи о принятии решений. За последнее десятилетие было много неординарных достижений в этой области — от однопользовательских и многопользовательских игр, таких как го и видеоигры Atari и Dota 2, до робототехники.
Эта книга — введение в глубокое обучение с подкреплением, уникально комбинирующее теорию и практику. Авторы начинают повествование с базовых сведений, затем подробно объясняют теорию алгоритмов глубокого RL, демонстрируют их реализации на примере программной библиотеки SLM Lab и напоследок описывают практические аспекты использования глубокого RL.
Руководство идеально подойдет как для студентов, изучающих компьютерные науки, так и для разработчиков программного обеспечения, которые знакомы с основными принципами машинного обучения и знают Python.
Прочитав эту книгу, вы:
- Разберетесь в каждом ключевом аспекте задач глубокого RL.
- Исследуете алгоритмы на основе стратегий и полезности, включая REINFORCE, SARSA, DQN, двойную DQN и приоритетное повторение опыта (PER).
- Углубитесь в комбинированные алгоритмы, такие как метод актора-критика и приближенная оптимизация стратегий (РРО).
- Узнаете, как выполнять синхронную и асинхронную параллелизацию.
- Научитесь выполнять алгоритмы глубокого RL в SLM LAB и изучите практические аспекты их реализации.
- Исследуете результаты тестов производительности с отрегулированными гиперпараметрами.
- Узнаете, как разрабатываются среды для глубокого RL.
Об авторах:
Лаура Грессер — программист-исследователь, занимается робототехникой в Google. Она окончила Нью-Йоркский университет, получив степень магистра со специализацией в машинном обучении.
Ван Лун Кенг — разработчик в сфере искусственного интеллекта, работает в компании Machine Zone, где применяет глубокое обучение с подкреплением к задачам промышленного уровня.