电子书:《hadoop构建数据仓库实践》《hadoop构建数据仓库实践》王雪迎20170701

电子书:《hadoop构建数据仓库实践》《hadoop构建数据仓库实践》王雪迎20170701

资源下载
仅限VIP下载,请先
犹豫不决让我们错失一次又一次机会!!!

电子书:《hadoop构建数据仓库实践》《hadoop构建数据仓库实践》王雪迎20170701

111

内容简介:

第2章数据仓库设计基础2.1关系数据樸型1.1关系数据模型中的结构完整性214关系数据模型与数据仓库2.2维度数据模型2.2.1维度数据模型建模过程22.2维度规范化2.23维度数据模型的特点224星型模式2.2.5雪花模式2.3 data vault模型2.3.1 data vault模型简介232 data vault模型的组成部分23.3 data vault模型的特点234 data vault模型的构建.…2.3.5 data vault模型实例24数据集市24.1数据集市的概念242数据集市与数据仓库的区别24.3数据集市设计2.5数据仓库实施步骤第3章 hadoop生态圈与数据仓库32.1 hadoop的构成..

hadoop构建数据仓库实践32.2 hadoop的主要特点…33 hadoop基本组件3.3.1hdf3.3.2 mapreduce3.3.3 yarn9062734 hadoop生态圈的其他组件3.5 hadoop与数据仓库3.5.1关系数据库的可扩展性瓶颈3.53 hadoop数据仓库工具3.6小结第4章安装 hadoop4.1 hadoop主要发行版本.4.1.1 cloudera distribution for hadoop(cdh)4. 1.2 hortonworks data platform (hdp)4. 1.3 mapr hadoop4.2安装 apache hadoop4.2.1安装环境914.2.2安装前准备4.2.3安装配置 hadoop42.4安装后配置29gg94.3配置 hdfs federation4.4离线安装cdh及其所需的服务44.1cdh安装概述44.2安装环境4.4.4 cloudera manager许可证管理

4.5小结第5章 kettle与 hadoop5.22连接hive53导出导入 hadoop集群数据1128531把数据从hdfs抽取到 rdbms1253.2向hive表导入数据54执行hive的 hiveql语句5.5 maple56 kettle提交 spark作业56.安装 spark56.2配置ketl向 spark集群提交作业5.7小结第6章建立数据仓库示例模型6.1业务场景62hive相关配置62.1选择文件格式62.2支持行级更新e事务支持的限制63hve表分类64向hive表装载数据6.5建立数据库表

hadoop构建数据仓库实践第7章数据抽取7.1逻辑数据映射据抽取方式73导出成文本文件7.5使用 scoop抽取数据52cdh570中的 snoop3使用 swoop抽取数据12037.54sqo0p优化7.6小结第8据转换与装载8.1数据清洗8.2hive简介82.1hive的体系结构822hve的工作流程216823hive服.务.器4hive客.户.端8.3初始装载84定期装载8.5hive优化8.6小结第9章定期自动执行etl作业9.20ozie简介92.1 oozie的体系结构…

9.22cdh5.7.0中的 oozie9.3建立定期装载工作流9.4建立协调器作业定期自动执行工作流9.6小结第10章维度表技术10.1增加列10.2维度子集10.3角色扮演维度104层次维度10.4.1固定深度的层次10.4.2104.3多路径层次10.44参差不齐的层次……131210.5退化维度10.6杂项维度10.7维度合并分段维度小结第11章事实表技术11.1事实表概述周期快照11.3累积快照114无事实的事实表11.6累积度量11.7小结

#############################################

资源下载
下载价格VIP专享
仅限VIP下载升级VIP
犹豫不决让我们错失一次又一次机会!!!
原文链接:https://1111down.com/223219.html,转载请注明出处

本站开启缓存功能

登入后回任何页面即可登入成功,当前页不显示

没有账号?注册  忘记密码?

社交账号快速登录