Как часто мы жалеем о том, что сделали или чего не совершили? Как часто нам хочется что-то изменить в своём прошлом? И если вдруг у нас появится такая возможность, уверены ли мы, что сделаем всё правильно, всё так, как мы на самом деле хотим? И не пожалеем ли мы потом об этом? Тем более если это будет билет в один конец. Тут ведь станцию назначения нужно выбирать очень и очень тщательно…
Глубокое обучение с подкреплением (глубокое RL) сочетает в себе два подхода к машинному обучению. В ходе такого обучения виртуальные агенты учатся решать последовательные задачи о принятии решений. За последнее десятилетие было много неординарных достижений в этой области — от однопользовательских и многопользовательских игр, таких как го и видеоигры Atari и Dota 2, до робототехники. Эта книга —...
Оставить комментарий