机读格式显示(MARC)
- 000 01348nam0 22003013 450
- 010 __ |a 978-7-5198-7037-9 |d CNY88.00
- 099 __ |a CAL 012023030354
- 100 __ |a 20230323d2023 em y0chiy50 ea
- 200 1_ |a 基于Python的强化学习 |A ji yu Python de qiang hua xue xi |f (美) 安德里亚·隆萨著 |d = Reinforcement learning algorithms with Python |f Andrea Lonza |g 刘继红, 王瑞文译 |z eng
- 210 __ |a 北京 |c 中国电力出版社 |d 2023
- 215 __ |a 265页 |c 图 |d 24cm
- 330 __ |a 本书涵盖的内容有: 强化学习概貌、强化学习过程与OpenAI Gym、基于动态规划的问题求解;Q-Llearning与SARSA的应用、深度Q神经网络、随机策略梯度优化、信赖域策略优化和近端策略优化、确定性策略梯度方法;基于模型的强化学习。模仿学习与DAgger算法;黑盒优化算法;开发ESBAS算法;应对强化学习挑战的实践。
- 500 10 |a Reinforcement learning algorithms with Python |A Reinforcement Learning Algorithms With Python |m Chinese
- 606 0_ |a 软件工具 |A ruan jian gong ju |x 程序设计
- 606 0_ |a 程序语言 |A Cheng Xu Yu Yan |x 程序设计
- 701 _1 |a 隆萨 |A Longsa |g (Lonza, Andrea) |4 著
- 702 _0 |a 刘继红 |A Liu Jihong |4 译
- 702 _0 |a 王瑞文 |A Wang Ruiwen |4 译
- 801 _0 |a CN |b DUTL |c 20230323
- 905 __ |a AUSTL |d TP311.561/L711