沃新书屋 - Spark技术内幕 - 作者:张安站

张安站

人物简介:

张安站,2008年本科毕业于天津大学,2011年研究生毕业于南开大学,毕业后加入EMC中国卓越研发集团,从事商业存储系统控制模块的研发。2014年7月加入百度上海研发中心,从事分布式系统架构相关工作,当前负责NLP Cloud(为公司内用户提供NLP核心算法的云平台)和Sofa Cloud(为策略服务化提供一站式解决方案的云平台)两个计算方向。目前专注分布式资源管理和大数据处理平台等相关技术。

Spark技术内幕书籍相关信息


内容简介:

Spark是不断壮大的大数据分析解决方案家族中备受关注的新增成员。它不仅为分布式数据集的处理提供一个有效框架,而且以高效的方式处理分布式数据集。它支持实时处理、流处理和批处理,提供了AllinOne的统一解决方案,使得Spark极具竞争力。 本书以源码为基础,深入分析Spark内核的设计理念和架构实现,系统讲解各个核心模块的实现,为性能调优、二次开发和系统运维提供理论支持;本文最后以项目实战的方式,系统讲解生产环境下Spark应用的开发、部署和性能调优。