Dimitri P. Bertsekas

人物简介:

暂无相关内容,正在全力查找中


阿尔法零对最优模型预测自适应控制的启示/信息技术和电气工程学科国际知名教材中译本系列书籍相关信息


内容简介:

德梅萃·P.博塞克斯(Dimitri P.Bertsekas)教授是国际运筹优化与控制领域的著名学者,其系列经典教材被清华大学、麻省理工学院等国内外高校广泛使用。本书构建了近似动态规划和强化学习的新的理论框架,简洁但雄心勃勃。这一框架以离线训练和在线学习这两类算法为中心,彼此独立又通过牛顿法有机融合。当今新一代人工智能技术发展绚丽多彩,在看似纷繁复杂的数据与算法表象之下,其实蕴藏着简洁而美妙的规律。通过本书的学习,读者将能体会经典优化控制理论在分析和理解当代强化学习算法性能中的强大威力,更能领悟到以阿尔法零为代表的新一代算法浪潮为经典理论提供的新的发展机遇。本书适合作为普通高等学校信息科学技术领域研究生、本科生高年级教材,也可供本领域科研人员自学参考。