沃新书屋 - 实用推荐系统 - azw3 网盘 高速 下载地址大全 免费
本书资料更新时间:2025-05-09 01:13:57

实用推荐系统 azw3 网盘 高速 下载地址大全 免费

实用推荐系统精美图片
其他格式下载地址

实用推荐系统书籍详细信息


内容简介:

要构建一个实用的“智能”推荐系统,不仅需要有好的算法,还需要了解接收推荐的用户。本书分为两部分,第一部分侧重于基础架构,主要介绍推荐系统的工作原理,展示如何创建推荐系统,以及给应用程序增加推荐系统时,应该如何收集和应用数据;第二部分侧重于算法,介绍推荐系统的算法,以及如何使用系统收集的数据来计算向用户推荐什么内容。作者还讲述了如何使用最流行的推荐算法,并剖析它们在Amazon 和Netflix 等网站上的实际应用。 《实用推荐系统》适合对推荐系统感兴趣的开发人员阅读,从事数据科学行业的读者也能从书中获得启发。

书籍目录:

第1部分 推荐系统的准备工作 第1章 什么是推荐........................................................................................3 1.1 现实生活中的推荐 .......................................................................................3 1.1.1 推荐系统在互联网上大显身手 .......................................................5 1.1.2 长尾 ...................................................................................................5 1.1.3 Netflix 的推荐系统 ...........................................................................6 1.1.4 推荐系统的定义 .............................................................................13 1.2 推荐系统的分类 .........................................................................................15 1.2.1 域 .....................................................................................................16 1.2.2 目的 .................................................................................................16 1.2.3 上下文 .............................................................................................17 1.2.4 个性化级别 .....................................................................................17 1.2.5 专家意见 .........................................................................................19 1.2.6 隐私与可信度 .................................................................................19 1.2.7 接口 .................................................................................................20 1.2.8 算法 .................................................................................................23 1.3 机器学习与Netflix Prize .............................................................................24 1.4 MovieGEEKs网站 .......................................................................................25 1.4.1 设计与规范 .....................................................................................27 1.4.2 架构 .................................................................................................27 1.5 构建一个推荐系统 .....................................................................................29 小结 ......................................................................................................................31 第2章 用户行为以及如何收集用户行为数据................................................... 32 2.1 在浏览网站时Netflix如何收集证据 ..........................................................33 2.1.1 Netflix 收集的证据 .........................................................................35 2.2 寻找有用的用户行为 .................................................................................37 2.2.1 捕获访客印象 .................................................................................38 2.2.2 可以从浏览者身上学到什么 .........................................................38 2.2.3 购买行为 .........................................................................................43 2.2.4 消费商品 .........................................................................................44 2.2.5 访客评分 .........................................................................................45 2.2.6 以(旧的)Netflix 方式了解你的用户 .........................................48 2.3 识别用户 .....................................................................................................49 2.4 从其他途径获取访客数据 .........................................................................50 2.5 收集器 .........................................................................................................50 2.5.1 构建项目文件 .................................................................................52 2.5.2 数据模型 .........................................................................................52 2.5.3 告密者(snitch):客户端证据收集器 ..........................................53 2.5.4 将收集器集成到MovieGEEKs 中 .................................................54 2.6 系统中的用户是谁以及如何对其进行建模 .............................................57 小结 ......................................................................................................................60 第3章 监控系统.........................................................................................61 3.1 为什么添加仪表盘是个好主意 .................................................................62 3.1.1 回答“我们做得怎么样?” ...........................................................62 3.2 执行分析 .....................................................................................................64 3.2.1 网站分析 .........................................................................................64 3.2.2 基本统计数据 .................................................................................64 3.2.3 转化 .................................................................................................65 3.2.4 分析转化路径 .................................................................................69 3.2.5 转化路径 .........................................................................................70 3.3 角色 .............................................................................................................73 3.4 MovieGEEKs仪表盘 ...................................................................................76 3.4.1 自动生成日志数据 .........................................................................76 3.4.2 分析仪表盘的规范和设计 .............................................................77 3.4.3 分析仪表盘示意图 .........................................................................77 3.4.4 架构 .................................................................................................78 小结 ......................................................................................................................81 第4章 评分及其计算方法.............................................................................82 4.1 用户-商品喜好 ...........................................................................................83 4.1.1 什么是评分 .....................................................................................83 4.1.2 用户- 商品矩阵 .............................................................................84 4.2 显式评分和隐式评分 .................................................................................86 4.2.1 如何选择可靠的推荐来源 .............................................................87 4.3 重温显式评分 .............................................................................................88 4.4 什么是隐式评分 .........................................................................................88 4.4.1 与人相关的推荐 .............................................................................90 4.4.2 关于计算评分的思考 .....................................................................90 4.5 计算隐式评分 .............................................................................................93 4.5.1 看看行为数据 .................................................................................94 4.5.2 一个有关机器学习的问题 .............................................................98 4.6 如何计算隐式评分 .....................................................................................99 4.6.1 添加时间因素 ...............................................................................102 4.7 低频商品更有价值 ...................................................................................105 小结 ....................................................................................................................107 第5章 非个性化推荐................................................................................. 108 5.1 什么是非个性化推荐 ...............................................................................109 5.1.1 什么是广告 ...................................................................................109 5.1.2 推荐有什么作用 ...........................................................................110 5.2 当没有数据的时候如何做推荐 ...............................................................111 5.2.1 商品的十大排行榜 .......................................................................113 5.3 榜单的实现以及推荐系统组件的准备工作 ...........................................114 5.3.1 推荐系统组件 ...............................................................................114 5.3.2 GitHub 上的MovieGEEKs 网站代码 ..........................................116 5.3.3 推荐系统 .......................................................................................116 5.3.4 为MovieGEEKs 网站添加一个榜单 ...........................................116 5.3.5 使内容看起来更具吸引力 ...........................................................117 5.4 种子推荐 ...................................................................................................119 5.4.1 频繁购买的商品与你正在查看的商品很相似 ...........................120 5.4.2 关联规则 .......................................................................................121 5.4.3 实现关联规则 ...............................................................................126 5.4.4 在数据库中存储关联规则 ...........................................................130 5.4.5 计算关联规则 ...............................................................................131 5.4.6 运用不同的事件来创建关联规则 ...............................................133 小结 ....................................................................................................................133 第6章 冷用户(冷商品)........................................................................... 135 6.1 什么是冷启动 ...........................................................................................135 6.1.1 冷商品 ...........................................................................................137 6.1.2 冷用户 ...........................................................................................137 6.1.3 灰羊 ...............................................................................................139 6.1.4 现实生活中的例子 .......................................................................139 6.1.5 面对冷启动你能做什么 ...............................................................140 6.2 追踪访客 ...................................................................................................141 6.2.1 执着于匿名用户 ...........................................................................141 6.3 用算法来解决冷启动问题 .......................................................................141 6.3.1 使用关联规则为冷用户创建推荐信息 .......................................142 6.3.2 使用领域知识和业务规则 ...........................................................143 6.3.3 使用分组 .......................................................................................144 6.3.4 使用类别来避免灰羊问题以及如何介绍冷商品 .......................146 6.4 那些不询问就很难被发现的人 ...............................................................147 6.4.1 当访客数据不够新时 ...................................................................148 6.5 使用关联规则快速进行推荐 ...................................................................148 6.5.1 收集数据项 ...................................................................................149 6.5.2 检索关联规则并根据置信度对其排序 .......................................150 6.5.3 显示推荐内容 ...............................................................................151 6.5.4 评估 ...............................................................................................154 小结 ....................................................................................................................154 第2部分 推荐算法 第7章 找出用户之间和商品之间的相似之处................................................. 157 7.1 什么是相似度 ...........................................................................................158 7.1.1 什么是相似度函数 .......................................................................159 7.2 基本的相似度函数 ...................................................................................160 7.2.1 Jaccard 距离 ..................................................................................161 7.2.2 使用Lp-norm 测量距离 ................................................................162 7.2.3 Cosine 相似度 ...............................................................................165 7.2.4 通过Pearson 相关系数查找相似度 .............................................167 7.2.5 运行Pearson 相似度 .....................................................................169 7.2.6 Pearson 相关性系数与Cosine 相似度类似 .................................171 7.3 k-means聚类 ..............................................................................................171 7.3.1 k-means 聚类算法 .........................................................................172 7.3.2 使用Python 实现k-means 聚类算法 ..........................................174 7.4 实现相似度 ...............................................................................................178 7.4.1 在MovieGEEKs 网站上实现相似度 ...........................................181 7.4.2 在MovieGEEKs 网站上实现聚类 ...............................................183 小结 ....................................................................................................................187 第8章 邻域协同过滤................................................................................. 188 8.1 协同过滤:一节历史课 ...........................................................................190 8.1.1 当信息被协同过滤时 ...................................................................190 8.1.2 互帮互助 .......................................................................................190 8.1.3 评分矩阵 .......................................................................................192 8.1.4 协同过滤管道 ...............................................................................193 8.1.5 应该使用用户- 用户还是物品- 物品的协同过滤 ...................194 8.1.6 数据要求 .......................................................................................195 8.2 推荐的计算 ...............................................................................................195 8.3 相似度的计算 ...........................................................................................196 8.4 Amazon预测物品相似度的算法 ..............................................................196 8.5 选择邻域的方法 .......................................................................................201 8.6 找到正确的邻域 .......................................................................................203 8.7 计算预测评分的方法 ...............................................................................204 8.8 使用基于物品的过滤进行预测 ...............................................................206 8.8.1 计算物品的预测评分 ...................................................................206 8.9 冷启动问题 ...............................................................................................207 8.10 机器学习术语简介 .................................................................................208 8.11 MovieGeeks网站上的协同过滤 .............................................................209 8.11.1 基于物品的过滤 ........................................................................209 8.12 关联规则推荐和协同推荐之间有什么区别 .........................................215 8.13 用于协同过滤的工具 .............................................................................215 8.14 协同过滤的优缺点 .................................................................................217 小结 ....................................................................................................................218 第9章 评估推荐系统................................................................................. 219 9.1 推荐系统的评估周期 ...............................................................................220 9.2 为什么评估很重要 ...................................................................................221 9.3 如何解释用户行为 ...................................................................................222 9.4 测量什么 ...................................................................................................223 9.4.1 了解我的喜好,尽量减少预测错误 ...........................................223 9.4.2 多样性 ...........................................................................................224 9.4.3 覆盖率 ...........................................................................................225 9.4.4 惊喜度 ...........................................................................................227 9.5 在实现推荐之前 .......................................................................................228 9.5.1 验证算法 .......................................................................................228 9.5.2 回归测试 .......................................................................................229 9.6 评估的类型 ...............................................................................................230 9.7 离线评估 ...................................................................................................231 9.7.1 当算法不产生任何推荐时该怎么办 ...........................................231 9.8 离线实验 ...................................................................................................232 9.8.1 准备实验数据 ...............................................................................237 9.9 在MovieGEEKs中实现这个实验 .............................................................244 9.9.1 待办任务清单 ...............................................................................244 9.10 评估测试集 .............................................................................................248 9.10.1 从基线预测器开始 ...................................................................248 9.10.2 找到正确的参数 .......................................................................251 9.11 在线评估 ..................................................................................................252 9.11.1 对照实验 ....................................................................................252 9.11.2 A/B 测试 ....................................................................................253 9.12 利用exploit/explore持续测试 .................................................................254 9.12.1 反馈循环 ...................................................................................255 小结 ....................................................................................................................256 第10章 基于内容的过滤............................................................................ 257 10.1 举例说明 .................................................................................................258 10.2 什么是基于内容的过滤 .........................................................................261 10.3 内容分析器 .............................................................................................262 10.3.1 从物品配置文件提取特征 .......................................................262 10.3.2 数量较少的分类数据 ...............................................................265 10.3.3 将年份转换为可比较的特征 ...................................................265 10.4 从描述中提取元数据 .............................................................................266 10.4.1 准备描述 ...................................................................................266 10.5 使用TF-IDF查找重要单词 .....................................................................270 10.6 使用LDA进行主题建模 .........................................................................272 10.6.1 有什么方法可以调整LDA ......................................................279 10.7 查找相似内容 .........................................................................................282 10.8 如何创建用户配置文件 .........................................................................283 10.8.1 使用LDA 创建用户配置文件 .................................................283 10.8.2 使用TF-IDF 创建用户配置文件 .............................................283 10.9 MovieGEEKs中基于内容的推荐 ...........................................................286 10.9.1 加载数据 ...................................................................................286 10.9.2 训练模型 ...................................................................................287 10.9.3 创建物品配置文件 ...................................................................288 10.9.4 创建用户配置文件 ...................................................................289 10.9.5 展示推荐 ...................................................................................291 10.10 评估基于内容的推荐系统 ...................................................................292 10.11 基于内容过滤的优缺点 ........................................................................293 小结 ....................................................................................................................294 第11章 用矩阵分解法寻找隐藏特征............................................................ 295 11.1 有时减少数据量是好事 ..........................................................................296 11.2 你想要解决的问题的例子 ......................................................................298 11.3 谈一点线性代数 ......................................................................................301 11.3.1 矩阵 ............................................................................................301 11.3.2 什么是因子分解 ........................................................................303 11.4 使用SVD构造因子分解 ..........................................................................304 11.4.1 通过分组加入添加新用户 ........................................................310 11.4.2 如何使用SVD 进行推荐 ..........................................................313 11.4.3 基线预测 ....................................................................................313 11.4.4 时间动态 ....................................................................................316 11.5 使用Funk SVD构造因子分解 ................................................................317 11.5.1 均方根误差 ................................................................................317 11.5.2 梯度下降 ....................................................................................318 11.5.3 随机梯度下降 ............................................................................321 11.5.4 最后是因子分解 ........................................................................322 11.5.5 增加偏差 ....................................................................................323 11.5.6 如何开始,何时结束 ................................................................324 11.6 用Funk SVD进行推荐 ............................................................................328 11.7 MovieGEEKs中的Funk SVD实现 ..........................................................331 11.7.1 如何处理异常值 ........................................................................335 11.7.2 保持模型的更新 ........................................................................336 11.7.3 更快的实施方法 ........................................................................337 11.8 显式数据与隐式数据 ..............................................................................337 11.9 评估 ..........................................................................................................337 11.10 用于Funk SVD的参数 ..........................................................................339 小结 ....................................................................................................................341 第12章 运用最佳算法来实现混合推荐......................................................... 342 12.1 混合推荐系统的困惑世界 .....................................................................343 12.2 单体 .........................................................................................................344 12.2.1 将基于内容的特征与行为数据混合,以改进协同过滤推荐系统 ......................................................................345 12.3 掺杂式混合推荐 .....................................................................................346 12.4 集成推荐 .................................................................................................347 12.4.1 可切换的集成推荐 ...................................................................348 12.4.2 加权式集成推荐 .......................................................................349 12.4.3 线性回归 ...................................................................................350 12.5 特征加权线性叠加(FWLS) ...............................................................351 12.5.1 元特征:权重作为函数 ...........................................................352 12.5.2 算法 ...........................................................................................353 12.6 实现 .........................................................................................................360 小结 ....................................................................................................................370 第13章 排序和排序学习............................................................................ 371 13.1 Foursquare的排序学习例子....................................................................372 13.2 重新排序 .................................................................................................376 13.3 什么是排序学习 .....................................................................................377 13.3.1 三种类型的LTR 算法 ..............................................................377 13.4 贝叶斯个性化排序 .................................................................................379 13.4.1 BPR 排序 ...................................................................................381 13.4.2 数学魔术(高级巫术) .............................................................383 13.4.3 BPR 算法 ...................................................................................386 13.4.4 具有矩阵分解的BPR ...............................................................387 13.5 BPR的实现 ..............................................................................................388 13.5.1 执行推荐 ...................................................................................393 13.6 评估 .........................................................................................................394 13.7 用于BPR的参数 ......................................................................................397 小结 ....................................................................................................................398 第14章 推荐系统的未来............................................................................ 399 14.1 本书内容总结 .........................................................................................400 14.2 接下来要学习的主题 .............................................................................403 14.2.1 延伸阅读 ...................................................................................403 14.2.2 算法 ...........................................................................................404 14.2.3 所处环境 ...................................................................................404 14.2.4 人机交互 ...................................................................................405 14.2.5 选择一个好的架构 ...................................................................405 14.3 推荐系统的未来是什么 .........................................................................406 14.4 最后的想法 .............................................................................................411

作者简介:

Kim Falk 是一位数据科学家,他在构建数据驱动的应用程序方面有着丰富的经验。他对推荐系统和机器学习很感兴趣。他所训练的推荐系统,为用户推荐合适的电影,为人们推送广告,甚至帮助律师找到判例法的内容。自2010 年以来,他一直从事大数据解决方案和机器学习方面的工作。Kim 经常参与有关推荐系统的演讲和写作。 当Kim 不工作的时候,他就是一个居家男人,是一位父亲,会带着他的德国短毛指示犬进行越野跑。

其它内容:

暂无其它内容!


下载点评

  • 分卷(840+)
  • 适合学生(830+)
  • 过期(1610+)
  • 扫描(1672+)
  • 朗读(297+)
  • 重排(674+)
  • 干货(650+)
  • 惊喜(920+)
  • 完整(602+)
  • 学者(517+)
  • 最新(1135+)
  • 适配(817+)
  • 愉快的找书体验(252+)
  • 排版满分(574+)
  • EPUB(281+)
  • 品质不错(671+)
  • 权威(412+)

下载评论

  • 用户1739126868: ( 2025-02-10 02:47:48 )

    高清的报告资源,双语设计提升阅读体验,体验良好。

  • 用户1741724067: ( 2025-03-12 04:14:27 )

    下载完这本书,我的知识又“膨胀”了!

  • 用户1721986013: ( 2024-07-26 17:26:53 )

    优质的报告资源,多格式设计提升阅读体验,操作便捷。

  • 用户1720604163: ( 2024-07-10 17:36:03 )

    互动版电子书下载流畅,支持MOBI/TXT格式导出,体验良好。

  • 用户1725800124: ( 2024-09-08 20:55:24 )

    高清版本小说资源,MOBI/AZW3格式适配各种阅读设备,体验良好。


相关书评

暂时还没有人为这本书评论!


以下书单推荐