书籍详情
《高效使用Greenplum:入门、进阶与数据中台王春波》[47M]百度网盘|亲测有效|pdf下载
  • 高效使用Greenplum:入门、进阶与数据中台王春波

  • 出版社:互动创新图书专营店
  • 热度:11499
  • 上架时间:2024-06-30 09:08:33
  • 价格:0.0
书籍下载
书籍预览
免责声明

本站支持尊重有效期内的版权/著作权,所有的资源均来自于互联网网友分享或网盘资源,一旦发现资源涉及侵权,将立即删除。希望所有用户一同监督并反馈问题,如有侵权请联系站长或发送邮件到ebook666@outlook.com,本站将立马改正

内容介绍

 书[0名0]:  高效使用G[*]eenplum:入门、进阶与数据中台|8084941  图书定价: 109元  图书作者: 王春波  出版社:  [1机1]械工业出版社  出版日期:  2021/12/3 0:00:00  ISBN号: 9787111696490  开本: 16开 页数: 388 版次: 1-1
 作者简介 王春波 著:作者介绍王春波资深架构师和数据仓库专家,现任上海启高信息科技有限公司[0大0]数据架构师,Apache Do[*]is和openGauss贡献者,G[*]eenplum中文社区参与者。具有十多年的数据仓库、数据集市、数据中台项目实战[纟巠]验,对[0大0]数据[1主1]流技术架构、产[0品0]选型与解决方案有深入研究,尤其擅长用[0优0]雅的SQL实现复杂的逻辑。常年奔波在各个项目交付现场,曾成功[1主1]导过中[0国0]邮政储蓄银行、南海农[0商0]银行、广东省联社、前海微众银行、广东南粤银行等多家银行的管理[0会0]计项目,以及卡宾、安踏、特步等多家零售鞋服企业的数据中台项目。公众号“数据中台研习社”运营者。
 内容简介 内容简介这不仅是一本从原理到使用、从入门到进阶讲解G[*]eenplum的著作,而且是一本指导企业用更省钱、更高效地方式使用G[*]eenplum构建企业级数据仓库和数据中台的著作。作者在数据架构和数据仓库一线工作10余年,积累了丰富的项目[纟巠]验,他用浅显易懂的语言、贴近生产环境的案例、丰富的示意图例写作了本书,能帮助读者快速掌握具有实战价值的[0知0]识。具体地,阅读本书你将收获如下内容:?掌握数据仓库技术的发展历程和发展方向;?理解MPP架构的架构特点和实现逻辑;?G[*]eenplum数据库的安装和基本[*]作;?G[*]eenplum数据库的工作原理;?SQL语句从入门到开发实战;?G[*]eenplum数据库ETL相关功能的具体用途;?[1机1]器[0学0]习、文本处理、图计算、GIS等的入门[0知0]识;?掌握G[*]eenplum数据库的运维和监控要点;?全[mian]掌握G[*]eenplum数据库的性能[0优0]化;?数据中台的理念和建设路径;?数据中台从接口到智能化应用的项目实战;?零售行业数据中台的项目实战案例。
 目录 序一序二序三前言[0第0]一部分 [0大0]数据平台概述[0第0]1章 [0大0]数据平台技术的演进21.1 关系型数据库21.1.1 数据库发展历程21.1.2 关系型数据库[0独0]霸天下41.1.3 结构化查询语言SQL41.1.4 列存储的兴起51.2 Hadoop生态系统71.2.1 Hadoop概述71.2.2 Hadoop生态圈71.2.3 Hadoop的[0优0]缺点91.3 [0No0]SQL的瓶颈和SQL数据库的回归101.3.1 [0No0]SQL产[0品0]的发展101.3.2 [0No0]SQL的共性111.3.3 SQL数据库的回归121.4 MPP架构的兴起141.4.1 什么是MPP架构141.4.2 MPP架构的蓬勃发展151.4.3 MPP数据库代表—TBase171.4.4 浅谈HTAP19[0第0]二部分 G[*]eenplum入门[0第0]2章 G[*]eenplum概述242.1 G[*]eenplum的前世今生242.2 G[*]eenplum数据库架构272.3 G[*]eenplum数据库的特点282.4 G[*]eenplum[亲斤]特性及展望302.5 G[*]eenplum的[0优0]势32[0第0]3章 G[*]eenplum的安装与部署353.1 G[*]eenplum数据库安装过程353.1.1 准备工作353.1.2 安装Maste[*]节点393.1.3 复制安装包到其他节点413.1.4 初始化G[*]eenplum数据库423.2 安装GPCC433.3 G[*]eenplum访问接口463.3.1 CLI463.3.2 JDBC473.3.3 ODBC483.4 G[*]eenplum数据库常用命令483.4.1 启动和停止483.4.2 修改参数493.4.3 其他常用命令513.5 G[*]eenplum性能测试52[0第0]4章 G[*]eenplum使用入门544.1 数据类型详解544.1.1 基本数据类型544.1.2 特殊数据类型564.1.3 组合数据类型604.2 数据表的基本使用624.2.1 表对象定义624.2.2 表的基本[*]作634.2.3 数据的基本[*]作644.3 数据表的高级应用654.3.1 数据表的存储特性694.3.2 分区表详解724.3.3 外部表764.4 数据库函数794.4.1 数[0学0]函数794.4.2 三角函数列表804.4.3 字符串函数和[*]作符804.4.4 类型转换相关函数824.4.5 自定义函数834.5 数据库的其他对象854.5.1 视图854.5.2 索引854.5.3 序列87[0第0]三部分 G[*]eenplum应用[0第0]5章 G[*]eenplum查询详解905.1 SQL语[0法0]925.1.1 简单SQL语[0法0]925.1.2 WITH子句特性955.1.3 IN语句和EXISTS语句985.1.4 MERGE子句的实现1005.2 JOIN[*]作1015.3 分析函数的妙用1065.4 高级函数精选110[0第0]6章 ETL工具箱1146.1 数据加载王者GPLoad1146.1.1 GPLoad简介1146.1.2 GPLoad配置详解1166.1.3 GPLoad实战1186.2 自定义存储过程1206.2.1 存储过程介绍 1206.2.2 存储过程应用模板1216.2.3 存储过程精选案例1226.3 PXF插[亻牛]1316.3.1 PXF简介1316.3.2 安装PXF1326.3.3 PXF实战1356.4 DBLink1366.4.1 DBLink简介1366.4.2 安装DBLink1376.4.3 DBlink实战1396.5 拉链表142[0第0]7章 G[*]eenplum高级应用1477.1 开放的编程接口1477.1.1 PL/Python1487.1.2 PL/R1507.2 MADlib[1机1]器[0学0]习库1537.2.1 安装MADlib1547.2.2 线性回归案例1577.2.3 关联规则案例1587.2.4 朴素贝叶斯分类案例1597.3 半结构化数据分析1647.4 地理空间数据分析1667.5 图计算应用168[0第0]8章 G[*]eenplum运维管理和监控1728.1 数据库管理1728.1.1 创建和管理数据库1728.1.2 创建和管理模式1738.1.3 创建和管理表空间1758.1.4 创建和管理用户1788.1.5 创建和管理资源队列1808.2 可视化监控页[mian]—GPCC1838.3 管理[女子]帮手—gp_toolkit1858.4 G[*]eenplum备份和恢复1878.5 在线扩容工具GPE[*]pand1898.5.1 G[*]eenplum扩容实战1898.5.2 扩容原理分析1918.6 锁[1机1]制1928.6.1 锁管理概述1928.6.2 普通锁数据结构192[0第0]9章 G[*]eenplum性能[0优0]化1979.1 系统级[0优0]化1979.1.1 [*]作系统选择1979.1.2 硬[亻牛]资源配置1989.1.3 磁盘读写1999.1.4 节点之间的网络带宽2029.1.5 系统参数2029.2 数据库级[0优0]化2049.2.1 数据库参数配置2049.2.2 资源队列2069.3 表级[0优0]化2069.3.1 建表参数2079.3.2 表的[0优0]化2089.4 执行计划和查询[0优0]化2099.4.1 查看执行计划2109.4.2 数据扫描方式2109.4.3 分布式执行方式2139.4.4 两种聚合方式2149.4.5 关联分类2149.4.6 [0优0]化器的选择2169.4.7 其他关键术语217[0第0]10章 G[*]eenplum与开源组[亻牛]22010.1 Kettle22010.2 DataX22410.3 HDFS、Hive和HBase22810.4 Spa[*]k23010.5 Kafka23510.6 Flink238[0第0]11章 G[*]eenplum与BI应用24411.1 Tableau24411.1.1 Tableau连接G[*]eenplum24511.1.2 Tableau[*]佳实践要点24511.2 [1永1]洪BI24811.3 帆软BI25011.4 DataV25311.5 Quick BI253[0第0]四部分 数据中台实战[0第0]12章 数据中台建设思路25612.1 为什么要搭建数据中台25612.2 什么是数据中台25812.3 如何搭建数据中台25912.3.1 数据资产盘点和规划25912.3.2 数据应用规划与设计26012.3.3 数据平台选型与建设26112.3.4 数据应用设计与实现26212.3.5 组织架构调整与流程变[*]26212.4 数据中台怎么选型26312.4.1 数据仓库选型26312.4.2 ETL工具选型26512.4.3 调度平台选型26612.4.4 BI工具选型268[0第0]13章 接口数据同步27013.1 全量接口同步27013.2 增量接口同步27613.3 流式数据同步28113.4 日志流数据同步283[0第0]14章 数据建模28514.1 数据建模思想28514.1.1 Inmon企业信息化工厂28614.1.2 Kimball的维度数据仓库28714.1.3 两种建模体系的对比28814.2 数据分层设计28814.2.1 [*]作数据存储层28914.2.2 数据仓库层29014.2.3 数据集市层29214.3 数据分层实战案例29314.3.1 ODS层29314.3.2 DWD层29314.3.3 DWB层29714.3.4 DWS层29914.3.5 ADS层30714.4 数据中台命[0名0]规范31114.4.1 数据库表命[0名0]31214.4.2 数据库字段命[0名0]31214.4.3 脚本命[0名0]规范313[0第0]15章 数据中台[1主1]要配套功能31415.1 数据[0权0]限管理31415.2 数据补录31915.3 BI门户32015.4 元数据管理32315.5 指标管理324[0第0]16章 数据中台数据应用32816.1 [0商0]业智能32816.2 自助分析平台33116.3 数据服务33216.4 标签平台33516.5 推荐系统338[0第0]17章 基于G[*]eenplum的数据中台实践案例34217.1 项目背景34217.2 项目需求34317.3 项目技术实现34417.3.1 系统架构34417.3.2 系统ETL分层34517.3.3 系统调度任务34617.4 智能数据应用34717.4.1 自助分析应用34817.4.2 固定报表34917.4.3 可视化[0大0]屏35017.4.4 钉钉数据服务35117.5 典型...
 编辑推荐 本书是春波一线实践[纟巠]验的积累和沉淀,内容覆盖了G[*]eenplum从入门到深入应用,再到运维监控和性能调[0优0]的各个方[mian]。此外,对数据中台的各个要素也进行了详细的讲解,用案例和图文并茂的方式阐述了基于G[*]eenplum的数据中台建设。——曹正炎 上海汉得信息技术股份有限公司数据研发中心总[纟巠]理本书对G[*]eenplum的技术特点、适用场景、常见问题等都做了非常详尽的阐述。难能可贵的是,作者结合项目实践,对如何利用G[*]eenplum数据库解决分析需求、服务业务创[亲斤]、发挥数据价值也给出了实用高效的[纟巠]验分享。对于初[0学0]者,本书可以帮助其快速成长为G[*]eenplum专业人才;对于有[纟巠]验的从业人员,本书也是难得的查漏补缺、总结[纟巠]验的工具书。——杨宏武 上海启高信息科技有限公司联合创始人兼CTO 本书通过讲背景、说架构、述功能、举案例的方式,由浅入深地层层剖析了G[*]eenplum的架构原理和功能组[亻牛],并通过实战项目讲述了G[*]eenplum适用的各项应用场景。——黎文惠 润智科技有限公司[0大0]数据架构师 市[mian]上关于Hive和Spa[*]k的书非常多,关于G[*]eenplum和数据中台结合的数据却没有,本书填补了这一空白。很多中小企业其实并不需要一套架构复杂的Hadoop平台,G[*]eenplum集群才是他们的[*]佳选择。——苏丹 成都慧择网络技术有限公司数据产[0品0][纟巠]理