实用推荐系统 azw3 网盘 高速 下载地址大全 免费

azw3电子书下载地址
其他格式下载地址
- 下载地址
- [pdf] 实用推荐系统
内容简介:
要构建一个实用的“智能”推荐系统,不仅需要有好的算法,还需要了解接收推荐的用户。本书分为两部分,第一部分侧重于基础架构,主要介绍推荐系统的工作原理,展示如何创建推荐系统,以及给应用程序增加推荐系统时,应该如何收集和应用数据;第二部分侧重于算法,介绍推荐系统的算法,以及如何使用系统收集的数据来计算向用户推荐什么内容。作者还讲述了如何使用最流行的推荐算法,并剖析它们在Amazon 和Netflix 等网站上的实际应用。
《实用推荐系统》适合对推荐系统感兴趣的开发人员阅读,从事数据科学行业的读者也能从书中获得启发。
书籍目录:
第1部分 推荐系统的准备工作
第1章 什么是推荐........................................................................................3
1.1 现实生活中的推荐 .......................................................................................3
1.1.1 推荐系统在互联网上大显身手 .......................................................5
1.1.2 长尾 ...................................................................................................5
1.1.3 Netflix 的推荐系统 ...........................................................................6
1.1.4 推荐系统的定义 .............................................................................13
1.2 推荐系统的分类 .........................................................................................15
1.2.1 域 .....................................................................................................16
1.2.2 目的 .................................................................................................16
1.2.3 上下文 .............................................................................................17
1.2.4 个性化级别 .....................................................................................17
1.2.5 专家意见 .........................................................................................19
1.2.6 隐私与可信度 .................................................................................19
1.2.7 接口 .................................................................................................20
1.2.8 算法 .................................................................................................23
1.3 机器学习与Netflix Prize .............................................................................24
1.4 MovieGEEKs网站 .......................................................................................25
1.4.1 设计与规范 .....................................................................................27
1.4.2 架构 .................................................................................................27
1.5 构建一个推荐系统 .....................................................................................29
小结 ......................................................................................................................31
第2章 用户行为以及如何收集用户行为数据................................................... 32
2.1 在浏览网站时Netflix如何收集证据 ..........................................................33
2.1.1 Netflix 收集的证据 .........................................................................35
2.2 寻找有用的用户行为 .................................................................................37
2.2.1 捕获访客印象 .................................................................................38
2.2.2 可以从浏览者身上学到什么 .........................................................38
2.2.3 购买行为 .........................................................................................43
2.2.4 消费商品 .........................................................................................44
2.2.5 访客评分 .........................................................................................45
2.2.6 以(旧的)Netflix 方式了解你的用户 .........................................48
2.3 识别用户 .....................................................................................................49
2.4 从其他途径获取访客数据 .........................................................................50
2.5 收集器 .........................................................................................................50
2.5.1 构建项目文件 .................................................................................52
2.5.2 数据模型 .........................................................................................52
2.5.3 告密者(snitch):客户端证据收集器 ..........................................53
2.5.4 将收集器集成到MovieGEEKs 中 .................................................54
2.6 系统中的用户是谁以及如何对其进行建模 .............................................57
小结 ......................................................................................................................60
第3章 监控系统.........................................................................................61
3.1 为什么添加仪表盘是个好主意 .................................................................62
3.1.1 回答“我们做得怎么样?” ...........................................................62
3.2 执行分析 .....................................................................................................64
3.2.1 网站分析 .........................................................................................64
3.2.2 基本统计数据 .................................................................................64
3.2.3 转化 .................................................................................................65
3.2.4 分析转化路径 .................................................................................69
3.2.5 转化路径 .........................................................................................70
3.3 角色 .............................................................................................................73
3.4 MovieGEEKs仪表盘 ...................................................................................76
3.4.1 自动生成日志数据 .........................................................................76
3.4.2 分析仪表盘的规范和设计 .............................................................77
3.4.3 分析仪表盘示意图 .........................................................................77
3.4.4 架构 .................................................................................................78
小结 ......................................................................................................................81
第4章 评分及其计算方法.............................................................................82
4.1 用户-商品喜好 ...........................................................................................83
4.1.1 什么是评分 .....................................................................................83
4.1.2 用户- 商品矩阵 .............................................................................84
4.2 显式评分和隐式评分 .................................................................................86
4.2.1 如何选择可靠的推荐来源 .............................................................87
4.3 重温显式评分 .............................................................................................88
4.4 什么是隐式评分 .........................................................................................88
4.4.1 与人相关的推荐 .............................................................................90
4.4.2 关于计算评分的思考 .....................................................................90
4.5 计算隐式评分 .............................................................................................93
4.5.1 看看行为数据 .................................................................................94
4.5.2 一个有关机器学习的问题 .............................................................98
4.6 如何计算隐式评分 .....................................................................................99
4.6.1 添加时间因素 ...............................................................................102
4.7 低频商品更有价值 ...................................................................................105
小结 ....................................................................................................................107
第5章 非个性化推荐................................................................................. 108
5.1 什么是非个性化推荐 ...............................................................................109
5.1.1 什么是广告 ...................................................................................109
5.1.2 推荐有什么作用 ...........................................................................110
5.2 当没有数据的时候如何做推荐 ...............................................................111
5.2.1 商品的十大排行榜 .......................................................................113
5.3 榜单的实现以及推荐系统组件的准备工作 ...........................................114
5.3.1 推荐系统组件 ...............................................................................114
5.3.2 GitHub 上的MovieGEEKs 网站代码 ..........................................116
5.3.3 推荐系统 .......................................................................................116
5.3.4 为MovieGEEKs 网站添加一个榜单 ...........................................116
5.3.5 使内容看起来更具吸引力 ...........................................................117
5.4 种子推荐 ...................................................................................................119
5.4.1 频繁购买的商品与你正在查看的商品很相似 ...........................120
5.4.2 关联规则 .......................................................................................121
5.4.3 实现关联规则 ...............................................................................126
5.4.4 在数据库中存储关联规则 ...........................................................130
5.4.5 计算关联规则 ...............................................................................131
5.4.6 运用不同的事件来创建关联规则 ...............................................133
小结 ....................................................................................................................133
第6章 冷用户(冷商品)........................................................................... 135
6.1 什么是冷启动 ...........................................................................................135
6.1.1 冷商品 ...........................................................................................137
6.1.2 冷用户 ...........................................................................................137
6.1.3 灰羊 ...............................................................................................139
6.1.4 现实生活中的例子 .......................................................................139
6.1.5 面对冷启动你能做什么 ...............................................................140
6.2 追踪访客 ...................................................................................................141
6.2.1 执着于匿名用户 ...........................................................................141
6.3 用算法来解决冷启动问题 .......................................................................141
6.3.1 使用关联规则为冷用户创建推荐信息 .......................................142
6.3.2 使用领域知识和业务规则 ...........................................................143
6.3.3 使用分组 .......................................................................................144
6.3.4 使用类别来避免灰羊问题以及如何介绍冷商品 .......................146
6.4 那些不询问就很难被发现的人 ...............................................................147
6.4.1 当访客数据不够新时 ...................................................................148
6.5 使用关联规则快速进行推荐 ...................................................................148
6.5.1 收集数据项 ...................................................................................149
6.5.2 检索关联规则并根据置信度对其排序 .......................................150
6.5.3 显示推荐内容 ...............................................................................151
6.5.4 评估 ...............................................................................................154
小结 ....................................................................................................................154
第2部分 推荐算法
第7章 找出用户之间和商品之间的相似之处................................................. 157
7.1 什么是相似度 ...........................................................................................158
7.1.1 什么是相似度函数 .......................................................................159
7.2 基本的相似度函数 ...................................................................................160
7.2.1 Jaccard 距离 ..................................................................................161
7.2.2 使用Lp-norm 测量距离 ................................................................162
7.2.3 Cosine 相似度 ...............................................................................165
7.2.4 通过Pearson 相关系数查找相似度 .............................................167
7.2.5 运行Pearson 相似度 .....................................................................169
7.2.6 Pearson 相关性系数与Cosine 相似度类似 .................................171
7.3 k-means聚类 ..............................................................................................171
7.3.1 k-means 聚类算法 .........................................................................172
7.3.2 使用Python 实现k-means 聚类算法 ..........................................174
7.4 实现相似度 ...............................................................................................178
7.4.1 在MovieGEEKs 网站上实现相似度 ...........................................181
7.4.2 在MovieGEEKs 网站上实现聚类 ...............................................183
小结 ....................................................................................................................187
第8章 邻域协同过滤................................................................................. 188
8.1 协同过滤:一节历史课 ...........................................................................190
8.1.1 当信息被协同过滤时 ...................................................................190
8.1.2 互帮互助 .......................................................................................190
8.1.3 评分矩阵 .......................................................................................192
8.1.4 协同过滤管道 ...............................................................................193
8.1.5 应该使用用户- 用户还是物品- 物品的协同过滤 ...................194
8.1.6 数据要求 .......................................................................................195
8.2 推荐的计算 ...............................................................................................195
8.3 相似度的计算 ...........................................................................................196
8.4 Amazon预测物品相似度的算法 ..............................................................196
8.5 选择邻域的方法 .......................................................................................201
8.6 找到正确的邻域 .......................................................................................203
8.7 计算预测评分的方法 ...............................................................................204
8.8 使用基于物品的过滤进行预测 ...............................................................206
8.8.1 计算物品的预测评分 ...................................................................206
8.9 冷启动问题 ...............................................................................................207
8.10 机器学习术语简介 .................................................................................208
8.11 MovieGeeks网站上的协同过滤 .............................................................209
8.11.1 基于物品的过滤 ........................................................................209
8.12 关联规则推荐和协同推荐之间有什么区别 .........................................215
8.13 用于协同过滤的工具 .............................................................................215
8.14 协同过滤的优缺点 .................................................................................217
小结 ....................................................................................................................218
第9章 评估推荐系统................................................................................. 219
9.1 推荐系统的评估周期 ...............................................................................220
9.2 为什么评估很重要 ...................................................................................221
9.3 如何解释用户行为 ...................................................................................222
9.4 测量什么 ...................................................................................................223
9.4.1 了解我的喜好,尽量减少预测错误 ...........................................223
9.4.2 多样性 ...........................................................................................224
9.4.3 覆盖率 ...........................................................................................225
9.4.4 惊喜度 ...........................................................................................227
9.5 在实现推荐之前 .......................................................................................228
9.5.1 验证算法 .......................................................................................228
9.5.2 回归测试 .......................................................................................229
9.6 评估的类型 ...............................................................................................230
9.7 离线评估 ...................................................................................................231
9.7.1 当算法不产生任何推荐时该怎么办 ...........................................231
9.8 离线实验 ...................................................................................................232
9.8.1 准备实验数据 ...............................................................................237
9.9 在MovieGEEKs中实现这个实验 .............................................................244
9.9.1 待办任务清单 ...............................................................................244
9.10 评估测试集 .............................................................................................248
9.10.1 从基线预测器开始 ...................................................................248
9.10.2 找到正确的参数 .......................................................................251
9.11 在线评估 ..................................................................................................252
9.11.1 对照实验 ....................................................................................252
9.11.2 A/B 测试 ....................................................................................253
9.12 利用exploit/explore持续测试 .................................................................254
9.12.1 反馈循环 ...................................................................................255
小结 ....................................................................................................................256
第10章 基于内容的过滤............................................................................ 257
10.1 举例说明 .................................................................................................258
10.2 什么是基于内容的过滤 .........................................................................261
10.3 内容分析器 .............................................................................................262
10.3.1 从物品配置文件提取特征 .......................................................262
10.3.2 数量较少的分类数据 ...............................................................265
10.3.3 将年份转换为可比较的特征 ...................................................265
10.4 从描述中提取元数据 .............................................................................266
10.4.1 准备描述 ...................................................................................266
10.5 使用TF-IDF查找重要单词 .....................................................................270
10.6 使用LDA进行主题建模 .........................................................................272
10.6.1 有什么方法可以调整LDA ......................................................279
10.7 查找相似内容 .........................................................................................282
10.8 如何创建用户配置文件 .........................................................................283
10.8.1 使用LDA 创建用户配置文件 .................................................283
10.8.2 使用TF-IDF 创建用户配置文件 .............................................283
10.9 MovieGEEKs中基于内容的推荐 ...........................................................286
10.9.1 加载数据 ...................................................................................286
10.9.2 训练模型 ...................................................................................287
10.9.3 创建物品配置文件 ...................................................................288
10.9.4 创建用户配置文件 ...................................................................289
10.9.5 展示推荐 ...................................................................................291
10.10 评估基于内容的推荐系统 ...................................................................292
10.11 基于内容过滤的优缺点 ........................................................................293
小结 ....................................................................................................................294
第11章 用矩阵分解法寻找隐藏特征............................................................ 295
11.1 有时减少数据量是好事 ..........................................................................296
11.2 你想要解决的问题的例子 ......................................................................298
11.3 谈一点线性代数 ......................................................................................301
11.3.1 矩阵 ............................................................................................301
11.3.2 什么是因子分解 ........................................................................303
11.4 使用SVD构造因子分解 ..........................................................................304
11.4.1 通过分组加入添加新用户 ........................................................310
11.4.2 如何使用SVD 进行推荐 ..........................................................313
11.4.3 基线预测 ....................................................................................313
11.4.4 时间动态 ....................................................................................316
11.5 使用Funk SVD构造因子分解 ................................................................317
11.5.1 均方根误差 ................................................................................317
11.5.2 梯度下降 ....................................................................................318
11.5.3 随机梯度下降 ............................................................................321
11.5.4 最后是因子分解 ........................................................................322
11.5.5 增加偏差 ....................................................................................323
11.5.6 如何开始,何时结束 ................................................................324
11.6 用Funk SVD进行推荐 ............................................................................328
11.7 MovieGEEKs中的Funk SVD实现 ..........................................................331
11.7.1 如何处理异常值 ........................................................................335
11.7.2 保持模型的更新 ........................................................................336
11.7.3 更快的实施方法 ........................................................................337
11.8 显式数据与隐式数据 ..............................................................................337
11.9 评估 ..........................................................................................................337
11.10 用于Funk SVD的参数 ..........................................................................339
小结 ....................................................................................................................341
第12章 运用最佳算法来实现混合推荐......................................................... 342
12.1 混合推荐系统的困惑世界 .....................................................................343
12.2 单体 .........................................................................................................344
12.2.1 将基于内容的特征与行为数据混合,以改进协同过滤推荐系统 ......................................................................345
12.3 掺杂式混合推荐 .....................................................................................346
12.4 集成推荐 .................................................................................................347
12.4.1 可切换的集成推荐 ...................................................................348
12.4.2 加权式集成推荐 .......................................................................349
12.4.3 线性回归 ...................................................................................350
12.5 特征加权线性叠加(FWLS) ...............................................................351
12.5.1 元特征:权重作为函数 ...........................................................352
12.5.2 算法 ...........................................................................................353
12.6 实现 .........................................................................................................360
小结 ....................................................................................................................370
第13章 排序和排序学习............................................................................ 371
13.1 Foursquare的排序学习例子....................................................................372
13.2 重新排序 .................................................................................................376
13.3 什么是排序学习 .....................................................................................377
13.3.1 三种类型的LTR 算法 ..............................................................377
13.4 贝叶斯个性化排序 .................................................................................379
13.4.1 BPR 排序 ...................................................................................381
13.4.2 数学魔术(高级巫术) .............................................................383
13.4.3 BPR 算法 ...................................................................................386
13.4.4 具有矩阵分解的BPR ...............................................................387
13.5 BPR的实现 ..............................................................................................388
13.5.1 执行推荐 ...................................................................................393
13.6 评估 .........................................................................................................394
13.7 用于BPR的参数 ......................................................................................397
小结 ....................................................................................................................398
第14章 推荐系统的未来............................................................................ 399
14.1 本书内容总结 .........................................................................................400
14.2 接下来要学习的主题 .............................................................................403
14.2.1 延伸阅读 ...................................................................................403
14.2.2 算法 ...........................................................................................404
14.2.3 所处环境 ...................................................................................404
14.2.4 人机交互 ...................................................................................405
14.2.5 选择一个好的架构 ...................................................................405
14.3 推荐系统的未来是什么 .........................................................................406
14.4 最后的想法 .............................................................................................411
作者简介:
Kim Falk 是一位数据科学家,他在构建数据驱动的应用程序方面有着丰富的经验。他对推荐系统和机器学习很感兴趣。他所训练的推荐系统,为用户推荐合适的电影,为人们推送广告,甚至帮助律师找到判例法的内容。自2010 年以来,他一直从事大数据解决方案和机器学习方面的工作。Kim 经常参与有关推荐系统的演讲和写作。
当Kim 不工作的时候,他就是一个居家男人,是一位父亲,会带着他的德国短毛指示犬进行越野跑。
其它内容:
暂无其它内容!
下载评论
-
用户1739126868:
( 2025-02-10 02:47:48 )
高清的报告资源,双语设计提升阅读体验,体验良好。
-
用户1741724067:
( 2025-03-12 04:14:27 )
下载完这本书,我的知识又“膨胀”了!
-
用户1721986013:
( 2024-07-26 17:26:53 )
优质的报告资源,多格式设计提升阅读体验,操作便捷。
-
用户1720604163:
( 2024-07-10 17:36:03 )
互动版电子书下载流畅,支持MOBI/TXT格式导出,体验良好。
-
用户1725800124:
( 2024-09-08 20:55:24 )
高清版本小说资源,MOBI/AZW3格式适配各种阅读设备,体验良好。
相关书评
暂时还没有人为这本书评论!
下载点评