汉语言文学网

人生哲理 英语文章 励志文章 人生感悟 爱情文章 经典文章 情感文章 伤感文章 心情文章 搞笑文章 非主流文章 亲情文章 读后感 观后感

动手学强化学习的读后感大全

时间: 2022-07-28 11:37:05  热度: 331℃ 

点击全文阅读

《动手学强化学习》是一本由张伟楠 / 沈键 / 俞勇著作,人民邮电出版社出版的平装图书,本书定价:89.90元,页数:277,特精心从网络上整理的一些读者的读后感,希望对大家能有帮助。

《动手学强化学习》读后感(一):已经迫不及待的想要读它啦

本书的作者张伟楠曾获得吴文俊人工智能优秀青年奖,对机器学习、强化学习颇有研究。看到张伟楠出版此书,我不禁的非常期待尽快能够拿到这本书并学习。

通过对前两章的试读,第一章讲解了什么是强化学习?强化学习的环境与目标,强化学习中的数据和强化学习的独特性。第二章介绍了多臂老虎机问题,问题介绍、探索与利用的平衡、贪婪算法、上置信界算法和汤普森算法。

对于我这个小白来说,本身深度学习还没搞明白的情况下,学习强化学习有些难度,但是作者通过知识讲解+图形化展示+代码编程的形式讲解强化学习,使得我对强化学习产生了浓厚的学习兴趣,说到这里,我非常期待能够尽快看完这本书,并通过书上的例子自己完成实现。

最后感谢人邮出版社和异步社区的大力支持,我才能够读到这么多好的书籍,感谢你们的无私付出。

《动手学强化学习》读后感(二):理论学习与动手实战兼顾的强化学习入门书

这是一本兼顾理论基础与前沿技术的强化学习入门书,指明了强化学习的入门及进阶路径 。

这本书的章节编排非常符合自学的需求:首先用图、文、公式结合的方式介绍算法的主要功能和适用场景,语言精练不啰嗦,对于一些难度较大的概念,还会适当举例以帮助读者理解;然后以伪代码块的形式总结算法的核心步骤;接着给出代码实现过程,关键代码处配有注释解读;最后展示算法的运行效果并对算法优缺点、改进方向加以分析,为硕士、博士等学生群体研究并改进算法提供了非常有借鉴价值的思路。

这本书的配套自学资源也非常丰富:扫描书中的二维码就可以跳转到配套网站中观看视频课程;可以在GitHub中找到最新的源代码,源代码使用Python 3和流行的PyTorch框架实现,无须配置环境,在和鲸平台上可以在线运行;读者在学习过程中有什么疑问的话,可以在网站评论区直接与作者交流。

这本书还提供了配套的课件,非常适合作为学校的教科书,减轻了老师们备课的负担,也满足了理论授课和上机实验两方面的教学需求。

《动手学强化学习》读后感(三):比较好的有关强化学习的图书,值得推荐

这本书是我目前读过的比较好的有关强化学习的图书,图书采用了大量的漫画形式的插图,通俗异动,同时,图书采用大量严谨性的语言,保证了在通俗易懂的基础上,确保概念的严谨性。实现序贯决策的机器学习方法便是强化学习,在此书中讲解的非常明确。广泛地讲,强化学习是机器通过与环境交互来实现目标的一种计算方法。图书通过大量举例来介绍这一方法,例如,将智能体的整体回报比作一场游戏最后的分值,提高了文本的可读性以及易理解的特性。

图书使用的大量插画,可以较好的吸引读者,容易使读者产生阅读兴趣,避免了某些图书,虽然严谨科学,但是容易“劝退”的效果。这极大的提高了全民学习的积极性,提高了入门人员的接受欲望。

这本书的配套资源也完善,扫描书中的二维码就观看视频课程;还可以获得最新的源代码,供读者学习使用。

随着人工智能技术的日渐发展,人工智能完成的任务也越来越多样化,全民学习的热潮也逐渐涌现,像这样一本,适合大都数读者阅读的好书,值得推荐。

《动手学强化学习》读后感(四):本书作者有话说

随着人工智能技术的日渐普及,人们对人工智能的期待越来越高,希望人工智能完成的任务也越来越多样化。在过去十多年的发展中,基于机器学习的智能检测和智能预测类的人工智能技术快速发展。例如,在门禁系统中应用的人脸活体检测、在个性化信息流推荐中应用的用 户兴趣预测已成为人们日常生活中不可或缺的技术。如今,在这些成熟的人工智能技术基础上, 服务于决策智能的技术变得越来越重要,这背后对应机器学习领域下的一个分支—强化学习。

目前强化学习技术已经在机器人控制、游戏智能、智慧城市、推荐系统、能源优化等领域得到广泛应用,发展前景广阔,业界对强化学习人才的需求量也与日俱增。但是,强化学习的普及教育较为滞后,不少高校仍未开设强化学习课程,学生迫切需要一条系统学习强化学习技术的专业路径。

本书的作者之一俞勇教授在上海交通大学致远学院、电子信息与电气工程学院为大三本科生开设了强化学习课程。目前这两个学院的强化学习课程在学生的培养方案中皆占 2 学分,包含授课和实验学时。在授课和批改学生的课程作业的过程中,我们发现强化学习对学生和老师来说都是一个难度较大的科目。对于学生,强化学习的理论属于机器学习大科目中的进阶内容, 涉及的数学内容比一般的有监督学习更加复杂,并且真正理解这些内容离不开第一手的编程和调试经验。例如,在Q-learning 算法中,如果直接学习函数 Q 的更新公式,很难看出它可能会出现过高价值估计的问题,更难以理解为何这种过高价值估计在深度强化学习任务下总是导致学习失败。只有通过实验对比,学生才能真切体会双 Q 函数给这种过高价值估计带来的减缓效益。对于老师,要做好强化学习的教学工作,将强化学习的理论原理和实践经验在 2 学分的课程中讲透,实属不易。部分学生反映强化学习的理论难度大、授课节奏快;部分学生反馈理论授课内容和课程作业的差距太大,无法轻松衔接。总体来说,要想扎实掌握强化学习技术,离不开动手实践,而市面上目前尚未见到集强化学习原理和动手实践于一体的权威图书。

在 2021 年春季上海交通大学致远学院 ACM 班的强化学习课程中,我们尝试以在线 Python Notebook 的形式为学生提供课程辅助材料和代码小作业。对于一个强化学习主题单元,我们将原理讲解部分(包括配图和公式)与对应的代码实践部分耦合,使学生在学习完一个原理知识点后能立即以代码实践的形式学习其实现方式。更重要的是,这样的代码块可以直接在线运行和修改,也就是说学生可以在一个 Notebook 里完成对一个强化学习主题单元的原理学习和代码实践。从学生的反馈来看,这样的学习方式能帮助他们更好地将理论知识点和实践能力点对应,也能帮助老师更高效地授课、布置和批改作业。随后,在 2021 年秋季电子信息与电气工程学院AI 专业的强化学习课程中,我们通过在线平台向学生完全公开了学习材料,并以“动手学强化学习”作为主要的课后学习形式,这种形式获得了学生更加积极的反馈。

基于在强化学习研究和教学中的浅薄经验,我们写作了这本《动手学强化学习》,旨在探索一种更好的强化学习教学方式,为我国强化学习的人才培养贡献一份力量。

猜你喜欢

推荐经典文章