数据科学入门（第2版）

数据科学入门（第2版）电子书籍推荐下载地址

》数据科学入门（第2版）电子书籍版权问题请点击这里查看《

数据科学入门（第2版）书籍详细信息

ISBN：9787115552761
作者：韩波 / [美] 乔尔•格鲁斯（Joel Grus） / 岳冰 / 高蓉
出版社：中国工信出版集团人民邮电出版社
出版时间：2020-12
页数：300
价格：109
纸张：暂无纸张
装帧：平装
开本：暂无开本
语言：暂无语言
丛书：O'Reilly动物系列（中译本）
原作名：Data Science from Scratch: First Principles with Python 2nd Edition
适合人群：初学者, 数据分析师, 软件工程师, 人工智能领域研究者, 对数据科学感兴趣的非专业人士, 大学生, 研究生
TAG：统计学 / 数据分析 / 编程入门 / 人工智能 / 数据科学 / 算法 / 机器学习 / 技术书籍 / Python编程
豆瓣评分：7
更新时间：2025-05-13 13:49:01

内容简介：

本书基于Python语言环境，从零开始讲解数据科学工作，讲述数据科学工作所需的技能与诀窍，并带领读者熟悉数据科学的核心知识：数学与统计学。作者借助大量具有现实意义的实例详细展示了什么是数据科学，介绍了从事数据科学工作需要用到的库，如NumPy、scikit-learn、pandas等，还在每章末尾推荐了很多学习资源，帮助你进一步巩固本书所学。新版基于Python 3.6，重写了所有示例和代码，并根据数据科学近几年的发展，新增了关于深度学习、统计学和自然语言处理等主题，让图书内容与时俱进。

书籍目录：

第1章导论　1 1.1 数据的崛起　1 1.2 什么是数据科学　1 1.3 激励假设：DataSciencester　2 1.3.1 寻找关键联系人　3 1.3.2 你可能知道的数据科学家　5 1.3.3 工资和工作年限　8 1.3.4 付费账户　10 1.3.5 感兴趣的主题　10 1.3.6 展望　12 第2章 Python速成　13 2.1 Python之禅　13 2.2 获取Python　14 2.3 虚拟环境　14 2.4 空白格式　15 2.5 模块　16 2.6 函数　17 2.7 字符串　18 2.8 异常　19 2.9 列表　19 2.10 元组　21 2.11 字典　22 2.12 计数器　24 2.13 集　24 2.14 控制流　25 2.15 真和假　26 2.16 排序　27 2.17 列表解析　27 2.18 自动化测试和断言　28 2.19 面向对象编程　29 2.20 迭代器和生成器　31 2.21 随机性　..32 2.22 正则表达式　33 2.23 函数式编程　34 2.24 压缩和参数拆分　34 2.25 args和kwargs　35 2.26 类型注释　36 2.27 欢迎来到DataSciencester　39 2.28 进一步探索　39 第3章数据可视化　40 3.1 matplotlib　40 3.2 条形图　42 3.3 线图　45 3.4 散点图　46 3.5 延伸学习　48 第4章线性代数　49 4.1 向量　49 4.2 矩阵　53 4.3 延伸学习　56 第5章统计学　57 5.1 描述单个数据集　57 5.1.1 中心倾向　59 5.1.2 离散度　61 5.2 相关　62 5.3 辛普森悖论　64 5.4 相关系数的其他注意事项　65 5.5 相关与因果　66 5.6 延伸学习　66 第6章概率　68 6.1 依赖和独立　68 6.2 条件概率　69 6.3 贝叶斯定理　71 6.4 随机变量　72 6.5 连续分布　72 6.6 正态分布　73 6.7 中心极限定理　76 6.8 延伸学习　78 第7章　假设和推论　79 7.1 统计假设检验　79 7.2 实例：掷硬币　79 7.3 p值　82 7.4 置信区间　84 7.5 p-Hacking　84 7.6 实例：运行A/B 测试　85 7.7 贝叶斯推断　86 7.8 延伸学习　89 第8章梯度下降　90 8.1 梯度下降的思想　90 8.2 估算梯度　91 8.3 使用梯度　94 8.4 选择正确步长　94 8.5 使用梯度下降拟合模型　95 8.6 小批次梯度下降和随机梯度下降　96 8.7 延伸学习　98 第9章获取数据　99 9.1 stdin和stdout　99 9.2 读取文件　101 9.2.1 文本文件的基础　101 9.2.2 限制的文件　102 9.3 网络抓取　104 9.4 使用API　106 9.4.1 JSON和XML　106 9.4.2 使用无验证的API　107 9.4.3 寻找API　108 9.5 实例：使用Twitter API　109 9.6 延伸学习　112 第10章数据工作　113 10.1 探索数据　113 10.1.1 探索一维数据　113 10.1.2 两个维度　115 10.1.3 多维数据　116 10.2 使用NamedTuple　18 10.3 数据类　119 10.4 清洗和修改　120 10.5 数据处理　122 10.6 数据调整　25 10.7 题外话：tqdm　126 10.8 降维　127 10.9 延伸学习　133 第11章机器学习　134 11.1 建模　134 11.2 什么是机器学习　135 11.3 过拟合与欠拟合　135 11.4 正确性　138 11.5 偏差–方差权衡　140 11.6 特征提取与选择　141 11.7 延伸学习　142 第12章 k最近邻法　143 12.1 模型　143 12.2 实例：鸢尾花数据集　145 12.3 维数灾难　148 12.4 进一步探索　152 第13章朴素贝叶斯算法　153 13.1 一个简易的垃圾邮件过滤器　153 13.2 一个复杂的垃圾邮件过滤器　154 13.3 算法实现　155 13.4 测试模型　157 13.5 使用模型　158 13.6 延伸学习　161 第14章简单线性回归　162 14.1 模型　162 14.2 使用梯度下降法　165 14.3 最大似然估计　166 14.4 延伸学习　166 第15章多元回归　167 15.1 模型　167 15.2 最小二乘模型的进一步假设　168 15.3 拟合模型　169 15.4 解释模型　171 15.5 拟合优度　171 15.6 题外话：Bootstrap　172 15.7 回归系数的标准误差　173 15.8 正则化　175 15.9 延伸学习　177 第16章逻辑回归　178 16.1 问题　178 16.2 logistic函数　180 16.3 应用模型　183 16.4 拟合优度　184 16.5 支持向量机　185 16.6 延伸学习　188 第17章决策树　89 17.1 什么是决策树　189 17.2 熵　191 17.3 分割的熵　193 17.4 创建决策树　194 17.5 综合运用　196 17.6 随机森林　199 17.7 延伸学习　199 第18章神经网络　200 18.1 感知器　200 18.2 前馈神经网络　202 18.3 反向传播　205 18.4 实例：Fizz Buzz　207 18.5 延伸学习　210 第19章深度学习　211 19.1 张量　211 19.2 层抽象　213 19.3 线性层　215 19.4 把神经网络作为层序列　218 19.5 损失函数与优化器　219 19.6 实例：重新设计异或网络　221 19.7 其他激活函数　222 19.8 实例：重新解决Fizz Buzz问题　223 19.9 softmax函数和交叉熵　224 19.10 丢弃　227 19.11 实例：MNIST　227 19.12 保存和加载模型　231 19.13 延伸学习　232 第20章聚类分析　233 20.1 原理　233 20.2 模型　234 20.3 实例：聚会　236 20.4 选择聚类数目k　238 20.5 实例：色彩聚类　239 20.6 自下而上的分层聚类　241 20.7 延伸学习　246 第21章自然语言处理　247 21.1 词云　247 21.2 n-gram 语言模型　249 21.3 语法　252 21.4 题外话：吉布斯采样　254 21.5 主题建模　255 21.6 词向量　260 21.7 递归神经网络　268 21.8 实例：使用字符级RNN　271 21.9 延伸学习　274 第22章网络分析　275 22.1 中介中心性　275 22.2 特征向量中心性　280 22.2.1 矩阵乘法　280 22.2.2 中心性　282 22.3 有向图与PageRank　283 22.4 延伸学习　286 第23章推荐系统　287 23.1 人工管理　288 23.2 推荐流行事务　288 23.3 基于用户的协同过滤　289 23.4 基于项目的协同过滤　292 23.5 矩阵分解　294 23.6 延伸学习　298 第24章数据库与SQL　299 24.1 CREATE TABLE与INSERT　299 24.2 UPDATE　302 24.3 DELETE　303 24.4 SELECT　304 24.5 GROUP BY　306 24.6 ORDER BY　308 24.7 JOIN　309 24.8 子查询　311 24.9 索引　312 24.10 查询优化　312 24.11 NoSQL　313 24.12 延伸学习　313 第25章 MapReduce　314 25.1 实例：单词计数　315 25.2 为什么是MapReduce　316 25.3 更一般化的MapReduce　317 25.4 实例：状态分析更新　318 25.5 实例：矩阵乘法　320 25.6 题外话：组合器　321 25.7 延伸学习　322 第26章数据伦理　323 26.1 什么是数据伦理　323 26.2 讲真的，什么是数据伦理　324 26.3 是否应该关注数据伦理　324 26.4 建立不良数据产品　325 26.5 精确与公平之间的较量　325 26.6 合作　327 26.7 可解释性　327 26.8 推荐　327 26.9 异常数据　328 26.10 数据保护　329 26.11 小结　329 26.12 延伸学习　329 第27章数据科学前瞻　330 27.1 IPython　330 27.2 数学　331 27.3 不从零开始　331 27.3.1 NumPy　331 27.3.2 pandas　331 27.3.3 scikit-learn　331 27.3.4 可视化　332 27.3.5 R　332 27.3.6 深度学习　332 27.4 寻找数据　333 27.5 从事数据科学工作　333 27.5.1 Hacker News　333 27.5.2 消防车　333 27.5.3 T恤　334 27.5.4 地球仪上的推文　334 27.5.5 你的发现　335 关于作者 336 关于封面 336

作者简介：

乔尔•格鲁斯（Joel Grus） Capital Group公司的首席机器学习工程师，担任过艾伦研究所的人工智能研发工程师以及谷歌公司的软件工程师，还曾在多家创业公司担任数据科学家。

其它内容：

暂无其它内容！

下载点评

珍藏(1007+)
感谢(215+)
稳定(367+)
力荐(249+)
感人(869+)
原版(680+)
强推(789+)
扫描(853+)
多格式(208+)
独家(222+)
精排(556+)
惊喜(576+)
感动(211+)
可编辑(972+)
可搜索(439+)
空洞无物(619+)
解决急需(914+)
可复制(975+)
批注(239+)

下载评论

用户1722976542： ( 2024-08-07 04:35:42 )
优质版本教材资源，EPUB/AZW3格式适配各种阅读设备，值得收藏。
用户1744009413： ( 2025-04-07 15:03:33 )
多格式版电子书下载秒传，支持EPUB/TXT格式导出，操作便捷。
用户1725547647： ( 2024-09-05 22:47:27 )
互动功能搭配AZW3/TXT格式，优质数字阅读体验，推荐下载。
用户1723190416： ( 2024-08-09 16:00:16 )
多格式功能搭配PDF/TXT格式，无损数字阅读体验，推荐下载。
用户1741399450： ( 2025-03-08 10:04:10 )
翻译质量很好，阅读流畅，适合深度思考。

数据科学入门（第2版）

数据科学入门（第2版）电子书籍推荐下载地址

数据科学入门（第2版）书籍详细信息

内容简介：

书籍目录：

作者简介：

其它内容：

下载点评

下载评论

相关书评

本书不适合入门

喜欢""的人也看了

运筹学习题集

21世纪经济管理精品教材·经济学系列:应用统计学

应用数理统计

应用数理统计

应用回归分析

应用抽样技术（第3版）/经济与管理类统计学系列教材

信息论基础

社会调查研究方法

误差理论与测量不确定度评定

污染源普查数据集