人工智能一大技术：强化学习（RL）

人工智能技术进步的速度越来越快，每种细分技术所创造的价值正日益得到展现。

2013年，DeepMind发明了DQN算法，成功将深度学习和强化学习结合起来，开启了深度强化学习的新纪元。此后数年，强化学习的成果日新月异，很多非常困难的问题都被深度强化学习算法解决。

2016年，谷歌阿尔法围棋以4:1战胜围棋世界冠军、职业九段棋手李世石，不仅让深度学习为人们所知，而且掀起了人工智能的“大众热”，大家由此更加关注强化学习这一技术要点。

使用强化学习的一个很好的例子是让机器人学习如何走路。机器人首先向前迈出一大步然后跌倒。这一大步和摔倒是强化学习系统关注的响应点。由于反馈是负面的，所以继续调整，系统会根据多个负反馈的比对最终确定机器人应该把步子迈的小一点，不停地小，直到机器人走路不会摔倒为止。

通过强化学习，Boston Dynamics公司的机器人已经掌握了托举、后空翻、跳上窗台的要点。而迪斯尼幻想工程已经把这一点带到了一个新的层面，那就是让人形机器人来执行玩命的特技。

有业内人士指出，强化学习和其他的人工智能技术有一个很大的差异，那就是它的学习范式和其它技术不太一样。它不需要我们去收集数据，也不需要我们去做任何标记，而是我们把称之为智能体(Agent)，放在一个环境里，就像动物或者我们自己生存的一个环境里，它会和环境自己打交道，自己学会在环境里如何完成一个任务，解决一个问题。

强化学习主要由智能体(Agent)、环境(Environment)、状态(State)和动作(Action)、奖励(Reward)组成。智能体将在环境的当前状态下，根据奖励信号做出动作，从而达到环境中的不同状态并得到奖励。

除了强化学习外，机器学习也备受关注。机器学习是AI的一个子集，是通过不同场景中的经验来训练系统的能力。随着车辆变得越来越自动化，开发人员可以使用机器学习训练系统来识别对象，并用更少的数据更好地解释其环境。

再来看一下深度学习。深度学习就是从有限样例中通过算法总结出一般性的规律，并可以应用到新的未知数据上。例如，我们可以从一些历史病例的集合中总结出症状和疾病之间的规律。这样，当有新的病人到来时，我们可以利用总结出来的规律来判断这个病人得了什么疾病。

那么，强化学习、机器学习、深度学习三者的区别是什么?简单说，人工智能范围最大，涵盖机器学习、深度学习和强化学习。如果把人工智能比喻成孩子大脑，那么机器学习是让孩子去掌握认知能力的过程，而深度学习是这种过程中很有效率的一种教学体系。

由强化学习、机器学习等技术构成的人工智能，其良好的发展前景引人期待。从全国来看，据艾瑞咨询测算，2022年国内人工智能核心产业规模有望达到1573亿元，复合增速达58%，产业将持续快速增长。如此广阔的市场空间，吸引着社会各界投资者的关注。

值得一提的是，发展“以人为本”的人工智能是全社会的课题，需要政府、商界、学界及所有利益相关方共担责任，协力推动。作为技术应用与推广的主体，企业负有不可推卸的社会责任。在研究强化学习相关技术时，企业要自觉遵守法规制度和社会公约，以此促进其有序、可持续应用。

未来，全球的可持续发展越来越依赖于数据创造的价值，而人工智能是数字经济中应用十分广泛的技术之一。或许再过几年，AI将在精准农业、智能家居、远程医疗、自动驾驶等领域发挥更加重要的作用。

作者：智能制造网_今日头条
原文链接：https://www.toutiao.com/i6908994949707153933/

转载请注明：www.ainoob.cn » 人工智能一大技术：强化学习（RL）

猜您还喜欢