在端到端的强化学习中端到端的过程换言之,整个过程涉及没有模块化的单层或循环神经系统,网络通过强化学习〈RL〉进行训练这种方法已经提出了很长时间,但在学习玩Atari视频游戏〈20l3_15)的成功结果中得到了重新激励。
RL通常需要显式设计状态空间和动作空间,而从状态空间到动作空间的眏射是学习的,因此RL一直限于仅仅为了行动而学习,并且人类设计师必须设计如何从传感器信号构成状态空间,并且在学习之前给出如何为每个动作产生运动命令。
端到端的RL扩展了RL
该方法起源于TD_GammO(1992)。通过使用分层神经网络的TD来学习自偶游戏期间的游戏情况的评估。
如果觉得《如何理解人工智能学习中端到端机器学习中的端到端 – CSS – 前端 commonnew.css》对你有帮助,请点赞、收藏,并留下你的观点哦!