书籍详情
《 深度强化学习--算法原理与金融实践入门》[77]百度网盘|亲测有效|pdf下载
  • 深度强化学习--算法原理与金融实践入门

  • 出版社:清华大学出版社
  • 作者:谢文杰、周炜星
  • 出版时间:2023-08-25
  • 热度:2655
  • 上架时间:2025-03-08 06:13:50
  • 价格:0.0
书籍下载
书籍预览
免责声明

本站支持尊重有效期内的版权/著作权,所有的资源均来自于互联网网友分享或网盘资源,一旦发现资源涉及侵权,将立即删除。希望所有用户一同监督并反馈问题,如有侵权请联系站长或发送邮件到ebook666@outlook.com,本站将立马改正

内容介绍

产品特色

编辑推荐

深度强化学习——算法原理与金融实践入门,将算法原理与金融实践结合,让读者深入理解深度强化学习的原理

 
内容简介

深度强化学习是人工智能和机器学习的重要分支领域,有着广泛应用,如AlphaGo和ChatGPT。本书作为该领域的入门教材,在内容上尽可能覆盖深度强化学习的基础知识和经典算法。全书共10章,大致分为4部分:第1部分(第1~2章)介绍深度强化学习背景(智能决策、人工智能和机器学习);第2部分(第3~4章)介绍深度强化学习基础知识(深度学习和强化学习);第3部分(第5~9章)介绍深度强化学习经典算法(DQN、AC、DDPG等);第4部分(第10章)为总结和展望。每章都附有习题并介绍了相关阅读材料,以便有兴趣的读者进一步深入探索。 本书可作为高等院校计算机、智能金融及相关专业的本科生或研究生教材,也可供对深度强化学习感兴趣的研究人员和工程技术人员阅读参考。

作者简介

谢文杰,男,湖南浏阳人,应用数学博士,上海市晨光学者。现任职华东理工大学商学院金融学系副教授、硕士研究生导师、金融物理研究中心成员,主要研究复杂金融网络、机器学习、深度强化学习、金融风险管理等。获2016年度上海市自然科学奖二等奖(4/5),主持完成4项国家或省部级科研项目。

周炜星,男,浙江诸暨人。青年长江学者、上海领军人才、新世纪优秀人才、上海市曙光学者、上海市青年科技启明星。现任职于华东理工大学商学院、数学学院,二级教授,博士生导师,金融物理研究中心主任。现兼任中国优选法统筹法与经济数学研究会理事、风险管理分会副理事长,中国系统工程学会理事、金融系统工程专业委员会副主任,管理科学与工程学会理事、金融计量与风险管理分会副理事长,中国工业统计教学研究会金融科技与大数据技术分会副理事长,中国数量经济学会经济复杂性专业委员会副理事长,中国复杂性科学学会副理事长。主要从事金融物理学、经济物理学和社会经济系统复杂性研究,以及相关领域大数据分析。

目  录
第 1章智能决策与复杂系统 . 1
第 1章习题 29
第 2章习题 58
第 3章深度学习入门 .59
3.4深度循环神经网络 69
第 3章习题 83
第 4章强化学习入门 .84
第 4章习题 .116
第 5章深度强化学习 Q网络 . 117
5.8.3模型训练 . 140
第 5章习题 .143
第 6章深度策略优化方法 . 144
第 6章习题 .168
第 7章深度确定性策略梯度方法 169
前  言
2016年,谷歌的 DeepMind团队研究人员在顶级期刊 Nature推出 AlphaGo,震撼了全世界。AlphaGo是第一个击败人类职业围棋选手、第一个战胜围棋世界冠军( 2016年李世石)的人工智能程序, AlphaGo使强化学习重新焕发出蓬勃生机。结合深度学习,深度强化学习在各大计算机科学顶级会议和科技公司的研究成果频频给人们带来激动人心的应用,让人们对通用人工智能的未来极为憧憬。深度强化学习融合深度学习的感知智能和强化学习的决策智能,在复杂环境决策模型中具有显著优势。同时,也有很多人对深度强化学习的未来提出质疑。伴随着质疑和赞美,深度强化学习领域持续改进和迭代,将走得更远,走得更长,为人类社会带来更多有益的成果。
人类不满足于深度强化学习在棋类游戏或者特定领域的进步,希望深度强化学习在人类社会中也能为社会经济体系统风险(如金融危机、经济危机、社会冲突等)的识别、度量、预警、防控和处置提供新的思路和方案。围棋策略空间的复杂度已经超出了一般人的决策能力范围,但相较于社会经济系统,围棋博弈的状态空间毕竟还是可数的且有限的,而社会系统、金融系统等都是无穷维数的复杂巨系统,能够在人类社会经济系统中训练智能体完成一些任务,具有巨大的挑战性,其难度远远大于 AlphaGo的设计和工程实践。

相关推荐