电子书:《hadoop+spark生态系统操作与实战指南》_余辉《hadoop+spark生态系统操作与实战指南》_余辉

电子书:《hadoop+spark生态系统操作与实战指南》_余辉《hadoop+spark生态系统操作与实战指南》_余辉

资源下载
仅限VIP下载,请先
犹豫不决让我们错失一次又一次机会!!!

电子书:《hadoop+spark生态系统操作与实战指南》_余辉《hadoop+spark生态系统操作与实战指南》_余辉

111

内容简介:

作者简介余辉.中guo科学院大学硕士研究生毕业.研究方向为云计算和大数据。现供职于某上市公司担任技术经理.并在oracle oaec人才产业集团大数据学院担任大数据讲师。曾在清华大学电子工程系 ngnlab研究室担任软件工程师。已发表两篇大数据论文:《微博舆情的 hadoop存储和管理平台设计与实现》和《跨媒体多源网络舆情分析系统设计与实现》

hadoop+ spark生态系统操作与实战指南余辉著等大学出版社北京仅供非商业用途或交流学习使用

内容简介本书用于 hadoop+ spark快速上手.全面解析 hadoop和spk生态系统.通过原理解说和实例操作每一个组件.让读者能够轻松跨入大数据分析与开发的大门全书共12章.大致分为3个部分.第1部分(第1-7章)讲解 hadoop的原生态组件.包括 hadoop. zookeeperhbse、hve环境搭建与安装.以及介绍 mapreduce.hdfs、zo0 keeper、 hbase.hve原理和 apache本环境下实战操作。第2部分(第8-11章)讲解 spark态组件.包括 spark core、 spark sql、 spark streamingdataframe.以及介绍 scala、 spark api、 spark sql、 spark streaming、 dataframe原理和cdh版本环境下实战操作.其中fhme和kaka属于 apache顶级开源项目也放在本篇讲解。第3部分(第12章)讲解两个大数据项目包络网 页ri志离线项目和实时项目.在cdh版本环境下通过这两个项目将 hadoop和 spark原生态组件进行整合一步步带领读者学习和实战操作。本书适合想要快速掌握大数据技术的初学者.也适合作为高等院校和培训机构相关专业师生的教学参考书和本书封面贴有清华大学出版社防伪标签.无标签者不得销售版权所有.侵权必究。侵权举报电话:010-6278298913701121933图书在版编目(c|p)数据hadoop+ spark生态系统操作与实战指南/余辉著.一北京:清华大学出版社.201isbn9787-30247967-3l.①h…ⅱ.①余…ⅲl①数据处理软件一指南ⅳv.①tp274中guo版本图书馆cip数据核字(2017)第207245号责任绵辑:夏毓彦封面设计:王翔责任校对;闫秀华出版发行:清华大学出版社地址;北京清华大学学研大厦a座邮编:100084社总机:010-62770175邮购:010-62786544投稿与读者服务:[email protected]质量反馈:[email protected]印装者;三河市铭诚印务有限公司经销:全guo新华书店开本:190mmx260mm字数:563千字版次:2017年9月第1版印次:2017年9月第1次印剧印数:1~3500定价:69.00元产品编号:076840-0仅供非商业用途或交流学习使用

推荐序大数据是继石油之后.新兴的一种guo家战略资源。大数据研究、开发和应用已经成为全球学术界、产业界的焦点。 hadoop、spak等开源项目是目前大数据领域应用最广泛的技术和平台。熟练掌握hado、 spark等是从事大数据研发和应用等从业人员必备的基本技能《 hadoop+ spark生态系统操作与实战指南》正是在这样的技术背景下应运而生.能极好地满足广大大数据从业者的需求。本书以原理介绍为基础.以实战训练为目标.具体、深入地阐述了 hadoop及 spark的原生态中每一个组件的基本原理和应用方法;选择 apache和cdh两个主流 hadoop版本作为剖析实例.通过java、 scala、客.户.端等开发案例.采用主流的离线项目和实时项目进行讲解作者根据自己多年在大数据行业的研发经验和个人体会.并结合大数据实际研发中需求和特点.认真整理其多年来编写的有关大数据研发的博文.精心组织和修订.最终编撰此著作馈食读者。因此.该著作既是在大数据一线研发人员的知识结晶.而且还是有意进军大数据领域的从业人员的“良师益友”.确实是一本难得的大数据研发的参考资料。黄永峰清华大学电子工程系教授、博士生导师仅供非商业用途或交流学习使用

hadoop+ spark生态系统操作与实战指南随着大数据时代的到来.大数据技术在各行各业的应用越来越多.大数据相关技术的学习和使用者也越来越多。《 hadoop-+ spark生态系统操作与实战指南》从大数据爱好者和入门者的角度出发.以原理兼实战为主体思路展现 hadoop及 spark的原生态中每一个组件的操作方法.是一本有效的快速入门教程本书首先讲解了 apache和cdh两大 hadoop版本的集群搭建.并以此作为后续的开发平台;其次.讲解了 hadoop+ spark中原生态组件的原理.并使用java、 scala、客.户.端对组件进行实例操作.作为案例:最后.通过两个网 页ri志分析项目将 hadoop和 spark中的原生态组件整合在一起.作为项目架构余辉毕业于中guo科学院大学.其研究方向为大数据与云计算.目前已拥有多年一线大数据开发经验。本书将理论与实践相结合.可作为相关技术教学和培训的参考资料。肖俊中guo科学院大学人工智能技术学院教授、副院长本书系统介绍了大数据相关知识.全书共有12章.论述了大数据的基本概念、大数据处理架构 hadoop、分布式文件系统hdfs、分布式数据库 hbase、 nosql数据库、云数据库分布式并行编程模型 mapreduce、基于_内.存_的分布式计算框架 spark、最新的 zookeeper.hivescala、 flume、kaka等技术。在 hadoop、hdfs、 hbase、 mapreduce和 spark等重要章节都安排了实践操作.让读者更好地学习和掌握大数据关键技术本文作者余辉工程师.在大数据领域的实验室及公司工作多年.积累了丰富的实战经验这本书理论结合实践.手把手教读者一步一步入门.避免了“纸上谈兵”.是大数据研究爱好者及从业人员的入门书籍本书可以作为高等院校计算机专业、信息管理等相关专业的大数据课程教材.也可供相关技术人员参考、学习、培训之用。中guo科学院计算机网络信息中心( cnic/cas)百人计划研究员、巴黎第13大学客座教授、里昂第1大学客座教授仅供非商业用途或交流学习使用

#############################################

资源下载
下载价格VIP专享
仅限VIP下载升级VIP
犹豫不决让我们错失一次又一次机会!!!
原文链接:https://1111down.com/224168.html,转载请注明出处

本站开启缓存功能

登入后回任何页面即可登入成功,当前页不显示

没有账号?注册  忘记密码?

社交账号快速登录