点击选择搜索分类

宋俊潇

人物简介：

郭宪，南开大学人工智能学院讲师。2009年毕业于华中科技大学机械设计制造及自动化专业，同年保送到中国科学院沈阳自动化研究所进行硕博连读，2016年1月获得工学博士学位，并到南开大学从事博士后研究工作，2018年7月任教于南开大学至今。目前主要研究方向和兴趣是仿生机器人智能运动控制、强化学习和机器人博弈。宋俊潇，香港科技大学博士，目前就职于启元世界，担任研究科学家，专注于决策智能相关算法的研究与开发。博士期间在国际知名期刊和会议发表论文9篇。2015年，获得阿里巴巴天池大数据黄金联赛个人年度第1名（参赛队伍总计15154支）。曾就职于网易游戏，担任资深数据挖掘研究员，负责个性化推荐算法及基于深度强化学习的游戏AI技术的探索研究，三次获得公司层面的技术进步奖。方勇纯，南开大学人工智能学院院长、教授、博士生导师，国家杰出青年基金获得者（2013年），教育部长江学者特聘教授（2017年）。1992~1994年在浙江大学混合班（尖子班）学习，获混合班荣誉证书。1996年和1999年分获浙江大学学士和硕士学位，2002年获美国克莱姆森大学（Clemson University）电机工程博士学位。2002至2003年在康乃尔大学（Cornell University）从事博士后研究。2003年底至今，任教于南开大学。目前主要研究方向为机器人视觉控制、无人机、欠驱动吊车系统和微纳米操作

深入浅出强化学习：编程实战书籍相关信息

ISBN：9787121367465
作者：郭宪 / 宋俊潇 / 方勇纯
出版社：中国工信出版集团电子工业出版社
出版时间：2020-3
页数：272
价格：89元
纸张：暂无纸张
装帧：平装
开本：暂无开本
语言：暂无语言
丛书：博文视点AI系列
适合人群：适合对机器学习和人工智能感兴趣的程序员，特别是那些想要学习并应用强化学习算法的开发者；对深度学习有基础了解的学习者；以及想要在科研或工业项目中应用强化学习的专业人士。
TAG：编程实战 / 人工智能 / 深度学习 / 算法 / 机器学习 / 强化学习
豆瓣评分：暂无豆瓣评分
更新时间：2025-05-10 03:22:06

内容简介：

《深入浅出强化学习：编程实战》是《深入浅出强化学习：原理入门》的姊妹篇，写作的初衷是通过编程实例帮助那些想要学习强化学习算法的读者更深入、更清楚地理解算法。本书首先介绍马尔可夫决策过程的理论框架，然后介绍基于动态规划的策略迭代算法和值迭代算法，在此基础上分3 篇介绍了目前强化学习算法中最基本的算法。第1 篇讲解基于值函数的强化学习算法，介绍了基于两种策略评估方法（蒙特卡洛策略评估和时间差分策略评估）的强化学习算法，以及如何将函数逼近的方法引入强化学习算法中。第2 篇讲解直接策略搜索方法，介绍了基本的策略梯度方法、AC 方法、PPO 方法和DDPG 算法。第3 篇讲解基于模型的强化学习方法，介绍了基于MPC 的方法、AlphaZero 算法基本原理及在五子棋上的具体实现细节。建议读者根据书中的代码亲自动手编程，并修改程序中的超参数，根据运行结果不断体会算法原理。

收藏人数最多的作品

深入浅出强化学习：编程实战

>>>查看宋俊潇更多作品

全格式电子版 - 免费下载

深入浅出强化学习：编程实战

【点击查看】直接下载文件

深入浅出强化学习：编程实战分类索引数据信息

ISBN：9787121367465
出版日期：2020-3
适合人群：适合对机器学习和人工智能感兴趣的程序员，特别是那些想要学习并应用强化学习算法的开发者；对深度学习有基础了解的学习者；以及想要在科研或工业项目中应用强化学习的专业人士。