R语言数据高效处理指南

R语言数据高效处理指南电子书籍推荐下载地址
内容简介:
R语言在近10年来已经发生了日新月异的变化,不仅在内容上更加丰富多彩,而且在计算效率上也有了大幅的提升。它被更加广泛地用于数据可视化、统计建模、机器学习等领域,而且还能实现网络爬虫、网络应用开发等功能,成为数据科学领域的全能型工具。R语言在学术界的地位已经不容置疑,在大数据时代中它是保证研究可重复性的重要工具。随着功能的日益完善,R语言已经进军工业界,并在金融、保险、医疗、生物和信息计量等不同的应用场景中大放异彩,潜力不可估量。
尽管R语言能够实现丰富多样的实际功能和框架,但是其本质是面向数据的,因此数据处理是R语言核心中的核心。如果能够掌握高效的数据操作技术,就能够在各类数据分析任务中如鱼得水。本书定位即为“R语言数据处理101”,希望R语言的使用者能够在较早的阶段就习得基本而有效的数据处理基本技术。
本书读者群体包括在校的大学生、数据分析从业人员和致力于更加高效地处理数据的所有的R语言使用者。尽管对数据科学、计算机编程、统计学有一定基础会帮助理解本书的内容,但这不是必需的,来自包括初学者在内的各个层次的读者群体都能从本书中有所收获。读者在本书中不仅能够学到数据处理中的实用技术,还能培养在数据分析中的探索性思维。可以作为零基础学习数据分析的教程、进阶数据分析实用技巧的参考书、常备查询的案头工具书,以及具有一定趣味性的数据分析入门启蒙书。
书籍目录:
第一部分 基础知识.
第1章 数据处理总论
1.1 数据处理的定义
1.2 数据处理的意义
1.3 数据处理基本工具
第2章 R语言编程基础
2.1 下载安装
2.2 包的使用
2.3 数据类型
2.4 数据结构
2.5 程序控制
2.6 函数式编程
第3章 数据处理基本范式.
第二部分 快速入门
第4章 base-R:基本数据处理.
4.1 数据集及其基本探索
4.2 基本范式实现
第5章 tidyverse 生态系统:简洁高效数据处理
5.1 tidyverse 生态系统简介
5.2 基本范式实现
5.3 高级处理工具
第三部分 高级进阶.93
第6章 data.table:高速数据处理.
6.1 data.table 简介
6.2 基本范式实现
6.3 高级特性探索
第7章 sparklyr: 分布式数据处理
7.1 连接R 与Spark:sparklyr 包简介
7.2 基本操作指南
7.3 存储机制简介
7.4 分布式计算
第四部分 实战应用.
第8章 航班飞行数据演练.
8.1 nycflights13 数据集探索
8.2 flights14 数据集探索
第9章 测试.
第10章 实用数据处理技巧.
10.1 数据存取
10.2 并行计算(doParallel)
10.3 混合编程
第11章 实战案例:网络爬虫与文本挖掘.
11.1 网络爬取(rvest)
11.2 文本挖掘(tidytext)
第12章 实战案例:数据塑型与可视化(ggplot2)
12.1 数据准备
12.2 柱状图(geom_bar)
12.3 折线图(geom_line)
12.4 饼图(ggpie)
12.5 一行代码实现一页多图(gridExtra)
第13章 实战案例:机器学习
13.1 机器学习概述
13.2 为什么要做机器学习
13.3 如何入门机器学习
13.4 数据处理与机器学习
13.5 案例分析:信贷风险预测模型构建
致谢
作者简介:
黄天元,复旦大学生态学博士在读,R语言忠实爱好者。热爱数据科学与开源工具,致力于利用数据科学迅速积累行业经验优势和科学知识发现,涉猎内容包括但不限于信息计量、机器学习、数据可视化、统计建模、知识图谱等。已发表SCI论文两篇,开设有知乎专栏“R语言数据挖掘”。
其它内容:
暂无其它内容!
下载评论
-
用户1740460427:
( 2025-02-25 13:13:47 )
无损版本报告资源,PDF/AZW3格式适配各种阅读设备,值得收藏。
-
用户1733276512:
( 2024-12-04 09:41:52 )
图文版电子书下载无延迟,支持MOBI/AZW3格式导出,推荐下载。
-
用户1723809851:
( 2024-08-16 20:04:11 )
支持目录跳转,查找内容很方便。
-
用户1738597196:
( 2025-02-03 23:39:56 )
排版精美,阅读体验很棒,感谢上传!
-
用户1732519695:
( 2024-11-25 15:28:15 )
互动功能搭配PDF/EPUB格式,精校数字阅读体验,资源优质。
相关书评
暂时还没有人为这本书评论!
下载点评