吾爱编程

标题: 深度强化学习 ( DQN )基本原理与AI项目实战 [打印本页]

作者: admin    时间: 2018-3-7 10:01
标题: 深度强化学习 ( DQN )基本原理与AI项目实战
强化学习是机器学习中的一个领域,强调如何基于环境而行动,以取得最大化的预期利益。其灵感来源于心理学中的行为主义理论,即有机体如何在环境给予的奖励或惩罚的刺激下,逐步形成对刺激的预期,产生能获得最大利益的习惯性行为。

在强化学习的世界里, 算法称之为Agent, 它与环境发生交互,Agent从环境中获取状态(state),并决定自己要做出的动作(action).环境会根据自身的逻辑给Agent予以奖励(reward)。奖励有正向和反向之分。比如在游戏中,每击中一个敌人就是正向的奖励,掉血或者游戏结束就是反向的奖励。

【课程内容】

强化学习简介
强化学习基本概念
马尔科夫决策过程
Bellman方程
值迭代求解
代码实战求解过程
QLearning基本原理
QLearning迭代计算实例
QLearning迭代效果
求解流程详解
DeepQnetwork原理
DQN网络细节
DQN网络参数配置
搭建DQN网络模型
DQN卷积操作定义
数据预处理
实验阶段数据存储
实现训练模块
Debug解读训练代码
完整代码流程分析
DQN效果演示

【下载地址】


作者: mono    时间: 2018-8-9 17:00
6666666666
作者: tsqy1860    时间: 2019-2-11 12:47
深度强化学习 ( DQN )基本原理与AI项目实战
作者: songlaf    时间: 2019-12-29 15:23
验阶段数据存储
实现训练模块
作者: emailtoy1ng    时间: 2020-2-19 12:27
深度强化学习 ( DQN )基本原理与AI项目实战
作者: 小凯酱    时间: 2020-12-9 14:54
膜拜神贴,后面的请保持队形~支持吾爱编程网!
作者: slkj_057    时间: 2021-2-26 23:55
看了LZ的帖子,我只想说一句很好很强大!支持吾爱编程网!




欢迎光临 吾爱编程 (http://www.52pg.net/) Powered by Discuz! X3.2