电子书:《flume日志收集与mapreduce模式》《flume日志收集与mapreduce模式》

电子书:《flume日志收集与mapreduce模式》《flume日志收集与mapreduce模式》

资源下载
仅限VIP下载,请先
犹豫不决让我们错失一次又一次机会!!!

电子书:《flume日志收集与mapreduce模式》《flume日志收集与mapreduce模式》

111

内容简介:

flumeri志收集与mapreduce模式美1史特夫·霍夫曼( steve hoffman斯里纳特?佩雷拉( srinath perera张龙译业出版社图书在版编目(cip)数据flumeri志收集与 mapreduce模式/(美)夫曼( hoffman.s.).(美)假雷拉( pereras.)著:张龙译.一北京:机械工业出版社.2015.5(2015.11重印大数据技术从书书名原文: apache flume: distrilog collection for ha1.f….0…②根张i.数据采集iv.tp274中guo版本图书馆cp数据核字(2015)第098968号本书版权登记号:图字steve hoffman: apache flume: distributed log collection for hadoop (isbn: 978-a: instant mapreduce patterns-hadoop essentials how-to (isbn978-1-782-16770-9)opyright o 2013 packt publishing. first published in the english languageunder the title -apache flumeifed language edition published by china machine press.copyright 0 2015 by china machine pre本书中文简体字版由 packt publishing i授权机械工业出版社独家出版。未经出板者书面许可.不得以任何方式复制或抄本书内容flumeri志收集与 mapreduce模式出版发行:机械工业出版社(北京市四区百万庄大街22号部段码:1003尚任:陈佳印;三河市宏图印务有限公司版次:2015年11月第1版第2次印同开本:147mmx210mm1/32书号:isbn978-7-111-50207-4定价:39.00元如有缺.倒页、页.由本社发行部调数投线010)683262948837964968995259读者信箱: hit (a hzboak.cshies’wh译者序今ri之时代是大数据时代.大数据在各行各业中都发挥着巨大的作用。这对于广大开发者们也提出了新的要求.如何追赶技术脚步、如何在大数据时代走在技术的前列成为摆在每一个技术人员面前的问题。提到大数据就不得不提到 hadoop以及围绕 hadoop形成的大数据生态系统: hbase、hive、pig、 zookeeper、 flumestom等。这其中更是以 hadoop为整个生态系统的核心和重中之重虽然面临着后来者 spark的挑战.但 hadoop凭借成熟的工具库、完善的生态系统、业界的广泛应用依旧深受各大互联网公司的青目前市场上关于 hadoop的技术图书已经汗牛充栋.那么.本书有哪些特点值得各位读者阅读呢?本书共包含两篇内容:上篇是关于apache flume的介绍;下篇是关于 mapreduce模式的介绍。上篇针对 apache flume进行了深入讲解。值得一提的是.目前市场上关于flume的技术图书非常少.本书的出现很好地填补了这一空白。该篇首先从fume的宏观架构谈起.接下来介绍如何安装与使用 flume然后对 flume e的核心组件通道、接收器、源、拦截器等进行深入讲解.最后介绍fume监控方面的知识并总结了实时分布式数据收集的现状。相信各位读者可以从中学到有关 apache flume方方面面的知识并能灵活地运用到项目中。对于 mapreduce1模式.下篇独辟蹊径.针对一个个问题分别进行介绍.弃了传统的流水账讲解方式.这样读者可以带着问题持续阅读.每一个案例最后都会给出相应的解决方案。这些案例都是与 hadoop相关的非常经典的案例.从最简单的使用java编写一个单词统计应用到复杂的使用 mapreduce?实现kmeans.相信各位读者从中可以学到许多关于 hadoop的知识。总的来说.这本涵盖 flume与 hadoop两个重要主题的图书会给各位读者带来耳目一新之感.同时这两个主题之间也存在着必然的联系.对有志于在大数据领域深耕的广大技术从业人员来说是一本上佳的领域专著翻译技术图书是一项艰苦的工作.首先非常感谢机械工业出版社华章公司的编辑们.感谢你们在图书翻译过程中给予我的支持与鼓励;此外.我还要对妻子张明辉说声感谢.你无微不至的关怀让我能够专心于翻译工作.同时也将本书献给我岁多的孩子张梓轩.希望你在未来能够茁壮成长;最后.我要感谢我的父母.没有你们的养育就不会有今天的我。尽管在翻译过程中本人已经付出了巨大的努力.但错误与遗漏之处在所难免.悬请广大读者将发现的错误及时告知于我以便在后续版本中能够及时更正。我的邮箱是 zhanglong217@163com.新 浪微博是@风中叶的思考.欢迎关注。张龙2015年4月前言hadoop是个非常优秀的开源工具.可以将海量的非结构化数据转换为易于管理的内容.从而更好地洞察客户需求。它很便宜(几乎是免费的).只要数据中心有空间和电源.它就能够水平扩展并且可以处理传统数据仓库难以解决的问题。需要注意的是.你得将数据填入 hadoop 3集群中.否则你所得到的只不过是昂费的热量产生器而已。你很快就会发现.一且对 hadoop的使用经过“试验性”阶段后.你就需要工具来自动化地将数据填充到集群中。过去你需要自己找到该问题的解决方案.但现在则不必如此! flume开始是 cloudera的项目.当时它们的集成工程师需要一次又一次地为客户编写工具来实现数据的自动化导入。时至今ri.fume已经成为 apache软件基金会的项目.并且处于活跃开发状态中.很多用户已经将其用于产品环境多年本书将会通过 flume的架构概览与快速起步指南帮助你迅速掌握 flume。接下来将会深入介绍 flume众多更加有用的组件的细节信息.包括用于即时数据记录持久化的重要的文件通道、用

#############################################

资源下载
下载价格VIP专享
仅限VIP下载升级VIP
犹豫不决让我们错失一次又一次机会!!!
原文链接:https://1111down.com/223234.html,转载请注明出处

本站开启缓存功能

登入后回任何页面即可登入成功,当前页不显示

没有账号?注册  忘记密码?

社交账号快速登录