电子书:《hadoop大数据实战权威指南》《hadoop大数据实战权威指南》

电子书:《hadoop大数据实战权威指南》《hadoop大数据实战权威指南》

资源下载
仅限VIP下载,请先
犹豫不决让我们错失一次又一次机会!!!

电子书:《hadoop大数据实战权威指南》《hadoop大数据实战权威指南》

111

内容简介:

数据科学与应用丛书hadoop大数据实战权威指南黄东军编著電子工掌出版publishing house of electronics industry北京 bejing

内容简介大数据贵在落实!本书是一本讲解大数据实战的图书.按照“深入分析组件原理、充分展示搭建过程、详细指导应用开发”编写。全书分为三篇.第一篇为大数据的基本概念和技术.主要介绍大数据的背景、发展及关键技术:第二篇为 hadoop大数据平台搭建与基本应用.内容涉及 linux、hdfs、 mapreduce、yarnhive、 hbase、 scoop、kafk、 spark等;第三篇为大数据处理与项目开发.包括交互式数据处理、协同过滤推荐系统、销售数据分析系统.并就京东的部分销售数据应用大数据进行处理分析本书适合初学者入门和进阶.也可供希望全面、系统地理解并掌握大数据实际应用的读者参考.对从事大数据项目开发的专业人员也有参考价值为了方便读者实践.本书配有开发资源包.读者可登.录华信教育资源网注册后下载hxedu. com. cn)免费未经许可.不得以任何方式复制或抄袭本书之部分或全部内容版权所有.侵权必究图书在版编目(c|p)数据hado0p大数据实战权威指南/黄东军编著.一北京:电子工业出版社.20177(大数据科学与应用丛书)isbn9787-121-31821-41.①h…ⅱ.①黄…ⅲ.①数据处理软件一指南ⅳv.tp2746中guo版本图书馆cp数据核字(2017)第129534号责任编辑:田宏峰印刷:三河市鑫金马印装有限公司装订:三河市鑫金马印装有限公司出版发行:电子工业出版社北京市海淀区万寿路173信箱邮编:100056开本:787×980116印张:23.5字数:526千字版次:2017年7月第1版印次:2017年7月第1次印刷定价:68.00凡所购买电子工业出版社图书有缺损问题.请向购买书店调换。若书店售缺.请与本社发行部联系联系及邮购电话010)88254888825888质量投诉请发邮件至[email protected].盗版侵权举报请发邮件至[email protected]本书咨询联系方式:tianhe(@phei.com.cn

刖本书内容本书分为共有12章第一篇大数据的基本概念和技术第1章绪论.描述大数据的时代背景与guo家大数据战略.探讨大数据的概念和特性.重点阐述大数据支撑体系.包括数据采集、存储、分布式计算和应用.并讨论大数据人才特点与能力要求第2章 hadoop大数据关键技术.详细介绍大数据系统涉及的主流技术.主要包括数据采集与生成、数据分布式存储、分布式计算框数据分析与挖掘等方面的技术和工具第二篇 hadoop大数据平台搭建与基本应用第3章 linux操作系统与集群搭建.介绍 linux集群的安装、java开发包jk的安装.以及集群的配置方法第4章hdfs安装与基本应用.介绍 hadoop hdfs的架构、工作原理.以及hadoop安装、配置、启动和程序的运行第5章 mapreduce与yarn.介绍 mapreduce的工作原理.描述 mapreduce2(也就是yarn)的架构和执行流程。本章重点介绍如何设计 mapreduce程序.给出了在eclipse中实现java语言 mapreduce程序的具体过程第6章hive和 hbase的安装与应用.主要介绍hive和 hbase的安装配置和应用方法.同时也介绍 mysql和 zookeeper的安装与应用第7章 snoop和kaka.介绍 scoop和kaka组件的安装及其基本应用方法第8章 spark集群安装与开发环境配置.介绍 spark架构及其工作原理.详细介绍spark开发环境的安装与配置.包括热门的 intellij idea集成开发环境的安装与基本

hadoop大数据实战权威指南第9章 spark应用基础.介绍 spark程序的运行模式和应用设计方法.通过编写计算圆周率pi、基于随机森林模型的贷款风险预測 scala程序.展示了在集成开发环境idea中编写 spark程序的流程第三篇大数据处理与项目开发一第10章交互式数据处理.介绍如何利用hive进行大数据处理和分析。hive是建立在 hadoop mapreduce基础上的数据仓库工具.用户借助ssol语句.可完成很多处理和分析.因此.对实际工作者有很大帮助。第11章协同过滤推荐系统.介绍推荐算法的基本概念和应用.展示基于 spark的机器学库mlib实现的协同推荐应用第12章销售数据分析系统.通过一个完整的销售数据分析系统设计.展示如何利用hado的各种组件开发实际的大数据应用系统。本章运用到的组件包括hdfsysql、 eclipse、 phoenix、 h base、 web collector. sevlet、 tomcat等.所展示的数据和应用均来自真实场景.对读者有较高参考价值。本书特点把原理、架构、运行流程分析与实际应用融合起来介绍.融合性阐述框架优于单纯的原理分析.因为原理最终要付诸应用。本书高度重视实践能力的培养.对系统安装、配置和应用过程给出了十分详细的描述.所有实验都是基于实际完成的操作介绍的.并配有现场截图.为读者展示了真实、详尽、可重现的场景.十分方便读者自学和钻研与很多大数据技术书籍不同.本书突出了数据处理本身.深入介绍了如何运用技术进实际的数据分析.所采用的数据样本来自生产一线.所展示的项目具有实用的参考价值.读者掌握这些技术之后.就可以开始进行项目开发了本书的读者群本书十分适合初学者入门和进阶。本书也可供那些已经学习过 hadoop组件技术.但希望全面、系统地理解并掌握实际应用的读者参考。本书对从事大数据项目开发的专业人员也有参考价值.书中所描述的 hadoop组件应用中遇到的各种问题及其解决办法.十分实用

本书特别适合自学.读者完全可以利用本书给出的资源和示例步一步地完成各项操作和应用.体验一种登堂入室的成就感致谢感谢大数据时代.感谢开源社区.感谢 apache基金会.感谢 google.感谢所有关心和热爱大数据的人们!作者在创作本书中借鉴了中科普开(北京)科技公司的部分培训资源.在此谨表示衷的感谢。特别感谢中南大学郑瑾副教授.本书的部分内容使用了她编撰的书稿。由衷地感谢王建新教授、李建彬教授、张祖平教授.他们耐心地审阅了本书.提出了中肯的意见和建议。非常感谢电子工业出版社田宏峰编辑.他细心专业的工作方式.给作者留下深刻印象.并为本书的高质量印装提供了保障。由于作者水平有限.本书的错误和疏漏在所难免.恳请广大读者提出宝贵意见和建议。联系邮箱:[email protected]年6月于长沙

#############################################

资源下载
下载价格VIP专享
仅限VIP下载升级VIP
犹豫不决让我们错失一次又一次机会!!!
原文链接:https://1111down.com/223220.html,转载请注明出处

本站开启缓存功能

登入后回任何页面即可登入成功,当前页不显示

没有账号?注册  忘记密码?

社交账号快速登录