:清华大学出版社

出版社信息:

类型:

成立时间:

出版社特色:

出版社简介:

暂无相关内容,正在全力查找中


PySpark机器学习、自然语言处理与推荐系统书籍相关信息

PySpark机器学习、自然语言处理与推荐系统精美图片

内容简介:

使用PySpark构建机器学习模型、自然语言处理应用程序以及推荐系统,从而应对各种业务挑战。本书首先介绍Spark的基础知识,然后讲解使用PySpark构建传统机器学习算法以及自然语言处理和推荐系统的全部知识点。 本书阐释了如何构建有监督机器学习模型,比如线性回归、逻辑回归、决策树和随机森林,还介绍了无监督机器学习模型,比如K均值和层次聚类。本书重点介绍特征工程,以便使用PySpark创建有用的特征,从而训练机器学习模型。自然语言处理的相关章节将介绍文本处理、文本挖掘以及用于分类的嵌入。 在阅读完本书之后,读者将了解如何使用PySpark的机器学习库构建和训练各种机器学习模型。此外,还将熟练掌握相关的PySpark组件,从而进行数据获取、数据处理和数据分析,开发数据驱动的智能应用。 构建一系列有监督和无监督机器学习算法 使用Spark MLlib库实现机器学习算法 使用Spark MLlib库开发推荐系统 处理与特征工程、分类平衡、偏差和方差以及交叉验证有关的问题,以便构建最优的拟合模型