Spark大数据实例开发教程 pdf下载
限时特惠
00:00:00
活动结束后恢复原价
纸质书参考价
¥23
电子版限时价
¥5.99
省 18 元
选择版本
内容简介
本篇主要提供Spark大数据实例开发教程电子书的pdf版本下载,本电子书下载方式为百度网盘方式,点击以上按钮下单完成后即会通过邮件和网页的方式发货,有问题请联系邮箱ebook666@outlook.com
编辑推荐
适读人群 :spark大数据开发者
大数据资深培训师、Spark大数据畅销书《大数据Spark企业级实战》作者王家林新作。
内容广度和深度兼顾,覆盖了Spark技术的核心知识点,全程注重从架构的底层到上层,由宏观到微观的讲解。
秉承“实战”类图书特色,解析大量案例和代码的编写操作,具有较强的可操作性,便于读者学习和理解。
大数据资深培训师、Spark大数据畅销书《大数据Spark企业级实战》作者王家林新作。
内容广度和深度兼顾,覆盖了Spark技术的核心知识点,全程注重从架构的底层到上层,由宏观到微观的讲解。
秉承“实战”类图书特色,解析大量案例和代码的编写操作,具有较强的可操作性,便于读者学习和理解。
内容简介
书中第1章首先通过介绍Spark的生态系统和RDD编程模型,使读者能够快速的对Spark技术的生态环境以及对Spark的RDD编程模型有个非常直观的了解。第2章,首先介绍了Spark应用的两种部署模式;然后在应用部署模式基础上,开始Spark实战的案例与解析,通过提供一个完整的基础案例,使读者了解一个Spark应用的大致处理流程;接着对实战中的重点部分,结合源码分析、监控日志分析等深入解析了Spark运行机制、DAG图等关键内容;后给出Spark开发者常用的应用程序构建案例与分析,以及调试环境搭建的案例与应用调试的案例。第3章重点针对SparkSQL子模块进行实战,首先概要分析了Spark1.3版本中引入的DataFrame,然后基于DataFrame编程模型给出一个完整的基础案例与解析,接着也是针对实战中的难度、重点部分,给予了更丰富的案例与深入地分析,后,重点关注Spark1.3版本中DataFrame当前支持的各种数据源,并给出各种数据源基础上的案例与分析,数据源包括各种结构化数据文件、Hive表、外部数据库或现有的RDD。第4章针对流处理进行实战,首先分析流处理中的关键点和难度,并通过实例进行深入解析。然后针对各种数据源的情景,给出由浅入深的实战案例与解析,并结合部分源码,分析流处理的性能调优等,并给出实例与分析。第5章针对著名的分布式内存存储系统Tachyon进行实战,并对实战案例进行分析,内容包括从Tachyon集群部署的案例与分析、Tachyon集群配置的案例与分析等,后关注Tachyon对Spark应用的性能调优的影响,给出实战案例及其深入解析。第6章通过大约30个动手实践的案例循序渐进地展示SparkGraphX框架方方面面的功能和使用方法,并对SparkGraphX的源码进行解析,并用综合实战案例巩固知识;第7章从快速入门机器学习开始,详细解析MLlib框架,通过对线性回归、聚类、协同过滤的算法解析、源码解析和案例实战,循序渐进地揭秘MLLib,后通过对MLlib中BasicStatics、朴素贝叶斯算法、决策树的解析和实战,进一步提升掌握Spark机器学习的技能。