数据挖掘与分析

数据挖掘与分析电子书籍推荐下载地址

》数据挖掘与分析电子书籍版权问题请点击这里查看《

数据挖掘与分析书籍详细信息

ISBN：9787115458421
作者：[美] Mohammed J. Zaki / [巴西] Wagner Meira Jr. / 吴诚堃
出版社：中国工信出版集团人民邮电出版社
出版时间：2017-8
页数：516
价格：129.00 元
纸张：暂无纸张
装帧：平装
开本：暂无开本
语言：暂无语言
丛书：图灵计算机科学丛书
适合人群：数据分析师，机器学习工程师，数据科学家，计算机科学和统计学专业的学生，IT行业从业者，对数据分析有浓厚兴趣的爱好者
TAG：统计学 / 数据分析 / 算法 / 机器学习 / 程序设计 / 大数据
豆瓣评分：8.1
更新时间：2025-05-10 00:53:25

内容简介：

数据挖据与分析的入门书，针对初学者阐述所有关键概念，包括探索性数据分析、频繁模式挖掘、聚类和分类。兼顾前沿话题，例如核方法、高维数据分析、复杂图和网络等。提供算法对应的开源实现方法。每章均有丰富示例和练习，帮助读者理解和巩固相关主题。配备丰富教辅资源，包括课程幻灯片、教学视频、数据集等，可从以下网址获取：http://www.dataminingbook.info/pmwiki.php/Main/BookResources。

书籍目录：

第1章　数据挖掘与分析　　1 1.1 数据矩阵　　1 1.2 属性　　2 1.3 数据的几何和代数描述　　3 1.3.1 距离和角度　　5 1.3.2 均值与总方差　　8 1.3.3 正交投影　　9 1.3.4 线性无关与维数　　10 1.4 数据：概率观点　　12 1.4.1 二元随机变量　　17 1.4.2 多元随机变量　　20 1.4.3 随机抽样和统计量　　21 1.5 数据挖掘　　22 1.5.1 探索性数据分析　　23 1.5.2 频繁模式挖掘　　24 1.5.3 聚类　　24 1.5.4 分类　　25 1.6 补充阅读　　26 1.7 习题　　26 第一部分　数据分析基础第2章　数值属性　　28 2.1 一元变量分析　　28 2.1.1 数据居中度度量　　29 2.1.2 数据离散度度量　　32 2.2 二元变量分析　　35 2.2.1 位置和离散度的度量　　36 2.2.2 相关性度量　　37 2.3 多元变量分析　　40 2.4 数据规范化　　44 2.5 正态分布　　46 2.5.1 一元正态分布　　46 2.5.2 多元正态分布　　47 2.6 补充阅读　　50 2.7 习题　　51 第3章　类别型属性　　53 3.1 一元分析　　53 3.1.1 伯努利变量（Bernoulli variable）　　53 3.1.2 多元伯努利变量　　55 3.2 二元分析　　61 3.3 多元分析　　69 3.4 距离和角度　　74 3.5 离散化　　75 3.6 补充阅读　　77 3.7 习题　　78 第4章　图数据　　79 4.1 图的概念　　79 4.2 拓扑属性　　83 4.3 中心度分析　　86 4.3.1 基本中心度　　86 4.3.2 Web中心度　　88 4.4 图的模型　　96 4.4.1 Erd?s-Rényi随机图模型　　98 4.4.2 Watts-Strogatz小世界图模型　　101 4.4.3 Barabási-Albert无标度模型　　104 4.5 补充阅读　　111 4.6 习题　　112 第5章　核方法　　114 5.1 核矩阵　　117 5.1.1 再生核映射　　118 5.1.2 Mercer核映射　　120 5.2 向量核　　122 5.3 特征空间中的基本核操作　　126 5.4 复杂对象的核　　132 5.4.1 字符串的谱核　　132 5.4.2 图节点的扩散核　　133 5.5 补充阅读　　137 5.6 习题　　137 第6章　高维数据　　139 6.1 高维对象　　139 6.2 高维体积　　141 6.3 超立方体的内接超球面　　143 6.4 薄超球面壳的体积　　144 6.5 超空间的对角线　　145 6.6 多元正态的密度　　146 6.7 附录：球面体积的推导　　149 6.8 补充阅读　　153 6.9 习题　　153 第7章　降维　　156 7.1 背景知识　　156 7.2 主成分分析　　160 7.2.1 最优线近似　　160 7.2.2 最优二维近似　　163 7.2.3 最优r维近似　　167 7.2.4 主成分分析的几何意义　　170 7.3 核主成分分析　　172 7.4 奇异值分解　　178 7.4.1 奇异值分解的几何意义　　179 7.4.2 奇异值分解和主成分分析之间的联系　　180 7.5 补充阅读　　182 7.6 习题　　182 第二部分　频繁模式挖掘第8章　项集挖掘　　186 8.1 频繁项集和关联规则　　186 8.2 频繁项集挖掘算法　　189 8.2.1 逐层的方法：Apriori算法　　191 8.2.2 事务标识符集的交集方法：Eclat算法　　193 8.2.3 频繁模式树方法：FPGrowth算法　　197 8.3 生成关联规则　　201 8.4 补充阅读　　203 8.5 习题　　203 第9章　项集概述　　208 9.1 最大频繁项集和闭频繁项集　　208 9.2 挖掘最大频繁项集：GenMax算法　　211 9.3 挖掘闭频繁项集：Charm算法　　213 9.4 非可导项集　　215 9.5 补充阅读　　220 9.6 习题　　221 第10章　序列挖掘　　223 10.1 频繁序列　　223 10.2 挖掘频繁序列　　224 10.2.1 逐层挖掘：GSP　　225 10.2.2 垂直序列挖掘：Spade　　226 10.2.3 基于投影的序列挖掘：PrefixSpan　　228 10.3 基于后缀树的子串挖掘　　230 10.3.1 后缀树　　230 10.3.2 Ukkonen线性时间算法　　233 10.4 补充阅读　　238 10.5 习题　　239 第11章　图模式挖掘　　242 11.1 同形和支撑　　242 11.2 候选生成　　245 11.3 gSpan算法　　249 11.3.1 扩展和支撑计算　　250 11.3.2 权威性测试　　255 11.4 补充阅读　　256 11.5 习题　　257 第12章　模式与规则评估　　260 12.1 规则和模式评估的度量　　260 12.1.1 规则评估度量　　260 12.1.2 模式评估度量　　268 12.1.3 比较多条规则和模式　　270 12.2 显著性检验和置信区间　　273 12.2.1 产生式规则的费希尔精确检验　　273 12.2.2 显著性的置换检验　　277 12.2.3 置信区间内的自助抽样　　282 12.3 补充阅读　　284 12.4 习题　　285 第三部分　聚类第13章　基于代表的聚类　　288 13.1 K-means 算法　　288 13.2 核K-means　　292 13.3 期望最大聚类　　295 13.3.1 一维中的EM　　297 13.3.2 d维中的EM　　300 13.3.3 极大似然估计　　305 13.3.4 EM方法　　309 13.4 补充阅读　　311 13.5 习题　　312 第14章　层次式聚类　　315 14.1 预备知识　　315 14.2 聚合型层次式聚类　　317 14.2.1 簇间距离　　317 14.2.2 更新距离矩阵　　321 14.2.3 计算复杂度　　322 14.3 补充阅读　　322 14.4 习题　　323 第15章　基于密度的聚类　　325 15.1 DBSCAN 算法　　325 15.2 核密度估计　　328 15.2.1 一元密度估计　　328 15.2.2 多元密度估计　　331 15.2.3 最近邻密度估计　　333 15.3 基于密度的聚类：DENCLUE　　333 15.4 补充阅读　　338 15.5 习题　　339 第16章　谱聚类和图聚类　　341 16.1 图和矩阵　　341 16.2 基于图的割的聚类　　347 16.2.1 聚类目标函数：比例割与归—割　　349 16.2.2 谱聚类算法　　351 16.2.3 最大化目标：平均割与模块度　　354 16.3 马尔可夫聚类　　360 16.4 补充阅读　　366 16.5 习题　　367 第17章　聚类的验证　　368 17.1 外部验证度量　　368 17.1.1 基于匹配的度量　　369 17.1.2 基于熵的度量　　372 17.1.3 成对度量　　375 17.1.4 关联度量　　378 17.2 内部度量　　381 17.3 相对度量　　388 17.3.1 分簇稳定性　　394 17.3.2 聚类趋向性　　396 17.4 补充阅读　　400 17.5 习题　　401 第四部分　分类第18章　基于概率的分类　　404 18.1 贝叶斯分类器　　404 18.1.1 估计先验概率　　404 18.1.2 估计似然　　405 18.2 朴素贝叶斯分类器　　409 18.3 K最近邻分类器　　412 18.4 补充阅读　　414 18.5 习题　　415 第19章　决策树分类器　　416 19.1 决策树　　417 19.2 决策树算法　　419 19.2.1 分割点评估度量　　420 19.2.2 评估分割点　　422 19.3 补充阅读　　429 19.4 习题　　429 第20章　线性判别分析　　431 20.1 最优线性判别　　431 20.2 核判别分析　　437 20.3 补充阅读　　443 20.4 习题　　443 第21章　支持向量机　　445 21.1 支持向量和间隔　　445 21.2 SVM：线性可分的情况　　450 21.3 软间隔SVM：线性不可分的情况　　454 21.3.1 铰链误损　　455 21.3.2 二次误损　　458 21.4 核SVM：非线性情况　　459 21.5 SVM训练算法　　462 21.5.1 对偶解法：随机梯度上升　　463 21.5.2 原始问题解：牛顿优化　　467 21.6 补充阅读　　473 21.7 习题　　473 第22章　分类的评估　　475 22.1 分类性能度量　　475 22.1.1 基于列联表的度量　　476 22.1.2 二值分类：正类和负类　　479 22.1.3 ROC分析　　482 22.2 分类器评估　　487 22.2.1 K折交叉验证　　487 22.2.2 自助抽样　　488 22.2.3 置信区间　　489 22.2.4 分类器比较：配对t检验　　493 22.3 偏置-方差分解　　495 22.4 补充阅读　　503 22.5 习题　　504

作者简介：

作者简介： Mohammed J. Zaki 伦斯勒理工学院计算机科学系教授，ACM杰出科学家，IEEE会士，目前致力于研究新数据挖掘技术。曾获得谷歌教职研究奖等诸多奖项。 Wagner Meira Jr. 巴西米纳斯联邦大学计算机科学系教授，数据库专家。译者简介：吴诚堃博士，2014年毕业于英国曼彻斯特大学，博士论文题为《应用大规模文本挖掘实现疾病分子机理重构》。现担任国防科技大学计算机学院助理研究员，从事高性能计算应用研究。

其它内容：

暂无其它内容！

下载点评

朗读(362+)
解决急需(1268+)
首选(539+)
批注(555+)
绝版(166+)
珍藏(937+)
考证(363+)
影印(126+)
深度(399+)
低清(553+)
可检索(696+)
最新(268+)
水印(767+)
力荐(612+)
清晰(496+)
云同步(814+)
感谢(485+)
超预期(478+)
修订(698+)

下载评论

用户1722992067： ( 2024-08-07 08:54:27 )
完整版本学术资源，PDF/TXT格式适配各种阅读设备，推荐下载。
用户1719464876： ( 2024-06-27 13:07:56 )
无延迟下载EPUB/TXT文件，无损报告推荐收藏，推荐下载。
用户1742469819： ( 2025-03-20 19:23:39 )
高清的学术资源，双语设计提升阅读体验，推荐下载。
用户1731864472： ( 2024-11-18 01:27:52 )
互动功能搭配PDF/MOBI格式，高清数字阅读体验，体验良好。
用户1742674280： ( 2025-03-23 04:11:20 )
极速下载PDF/EPUB文件，优质期刊推荐收藏，体验良好。

数据挖掘与分析

数据挖掘与分析电子书籍推荐下载地址

数据挖掘与分析书籍详细信息

内容简介：

书籍目录：

作者简介：

其它内容：

下载点评

下载评论

相关书评

喜欢""的人也看了

运筹学习题集

21世纪经济管理精品教材·经济学系列:应用统计学

应用数理统计

应用数理统计

应用回归分析

应用抽样技术（第3版）/经济与管理类统计学系列教材

信息论基础

社会调查研究方法

误差理论与测量不确定度评定

污染源普查数据集