电子书《apachekylin权威指南》《apachekylin权威指南》

电子书《apachekylin权威指南》《apachekylin权威指南》

资源下载
仅限VIP下载,请先
犹豫不决让我们错失一次又一次机会!!!

电子书《apachekylin权威指南》《apachekylin权威指南》

111

内容简介:

技术丛书apache kylin权威指南ache kylin核心团队著apache kylin机械工业出版图书在版编目(cip)数据apache kylin权威指南/ apache kylin核心团队著.一北京:机械工业出版社.2017.1isbn978-7-111-55701-2a….a…1.互联网络一网络服.务.器iv.tp368.5中guo版本图书馆cip数据核字(2016)第305395号apache and apache kylin are either registered trademarks or trademarks of the apache softwaretion in the us and/orimplied by thehese marksapache kylin权威指南出版发行:机械工业出版社(北京市西过责任编辑:张梦玲责任校对:蓝纪网ri刷:北京信伟业印有限公司版次:2017年1月第1版开本:186mmx24dmm1/书号:isbn978-7-111-55701-2定价:49.00元凡购本书.如有缺面、倒、脱页.由本社发行部调换投稿热线010)88379604购书热线010)683262948837964968995259读者信箱: hzit(@hzbook com版权所大成律事务所韩光/当东7neew推荐序2016年早些时候.我曾经写过一篇有关联通 hadoop的文章.在其中的“展望篇”里谈到过 olap on hadoop的新技术 apache kylin。今天《 apache kylin权威指南》一书即将版.我也有幸受本书作者之一韩卿(luke)的邀请来写推荐序联通集团的bi是2010年建设的.由于全guo有4亿用户的明细数据需要集中处理.再加上对移动互联网用户流量ri志的采集.使得数据量急增。截至2013年已达pb级规模.并仍以指数级速度增长.传统数据仓库不堪重负.数据的存储和批量处理成了瓶颈。另一方面bi上提供的面向用户的数据查询和多维分析服务.使得后台生产的cube越来越多.几年下来已有七八千个。用户需求对某一维度的改变往往会造成一个新cube的产生.耗费资源不说也为管理带来了极大的不便。2013年年底我们在传统数据仓库之外搭建了第一个 hadoop平台.节点数也从最初的几十个发展到了今天的3500个.大大提高了系统的存储及计算能力为联通大数据对内对外的发展都起到了至关重要的作用。美中不足的是分布式存储和并行计算只解决了系统的性能问题.尽管我们也部署了像hive、 impala这样的 sql on hadoop技术但在 hadoop体系上的多维联机分析(olap)却始终得不到满意的结果。 oracle+混搭架构还因为有对olap的需求而继续维持着.零散的cube数还在继续增长还在继续寻找奇迹方案的出现apache kylin就是在这种大背景下出现在我们的视野中的。一个好的产品首先要有一个清晰的定位.要有一套能够明确解决行业痛点的方案。 kylin在这点上做得非常好.它自己定义为 hadoop大数据平台上的一个开源olap引擎。三个关键词: hadoop、开源olap.使它的定位一目了然.不用过多地解释。同时. kylin也是透明的.不像许多产品把自己使用的技术搞得很神秘. kylin沿用了原来数据仓库技术中的cube概念.把无限数据按有限的维度进行“预处理”.然后将结果(cube)加载到 hbase里.供用户查询使用.使得现有的分析师和业务人员能够快速理解和掌握。相比于1oe时代的bl.它非常巧妙地使用了 hadoop i的分布式存储与并行计算能力.用横向可扩展的硬件资源来换取计算性能的极大为了能够将kyi真正融入到联通的大数据架构中.我们正在紧锣密鼓地组织系统测试比如对单用户级的数据查询、第三方可视化工具的集成、多维cube建立的维度数极限等的測试。我们还计划用 kafka来导入数据.用 spark来加工cube.用其他产品来代替 hbase进而提高数据读取性能.用 kylin的路由选择来桥接新老cube.等等。这时出版的《 apachekyin权威指南》一书.对于我们来说无疑是雪中之炭.我们的许多疑惑都会在这本指南当中找到权威解答。联通公司现在经历的这些过程很多企业都会週到.“坑”我们愿意去填.路希望大家来走。在向读者推荐( apache kylin i权威指南》一书的同时.我们真诚期望 kylin(作为apache开源社区第一个由中guo人开发并主导的产品)能够成功.能够在不断的实践中提高自能够充分利用中guo这个占世界数据量209?大市场.把自己打造成大数据领域的一只独范济安家千人计刻专家中guo联通集团信息化部ctow推荐序二我是一个开源软件的爱好者.算是开源届的一名老兵。从1995年到美guo留学起.就开始接触开源软件.当时的gnu、 linux、 freebsd和 emacs等自由软件让刚出guo门的我感到惊艳万分。从那时开始.我就再没有和自由软件、开源软件分开过:从读博土期间一直参与研发自由软件xsb、因个人爱好参与贡献 gnu emacs、在ibm工作期间基于一系列开源软件为团队开发 doc book文档写作工具链.到后来在 linkedin工作期间研究作为5个核心成员开源的分布式实时搜索系统 sensei.再到近几年在小米大力推动开源战略.打造基于开源软件的小米云计算、大数据和机器学习技术及团队。20多年来.对开源软件的热爱.让我逐渐从一名早期的自由软件爱好者、信仰者、贡献者和管理者.变成了一名坚定的开源软件倡导者。在这期间.我见证了开源技术的萌芽、兴起和今天的繁荣.也经历了guo内外不同文化下的开源发展历程作为一名参与开源软件较早的中guo人.我也深深地感受到了最初西方世界对中guo人使用开源技术、参与开源软件开发的质疑和冷落。因为互联网和自由软件进入我guo较晚.也因为中guo人在英语上的不足和东西方文化的差异.还因为早期guo内的一些开源爱好者对开源软件的理解不足.使得在开源方面较为领先的西方开源人土对guo人在开源上的使用和贡献存在极大偏见。中guo开源力量融入guo际开源社区的过程是缓慢和艰苦的.幸运的是.近四五年来.随着 git hub的兴起和多个开源社区的迅猛发展.中guo每年产生的计算机人才也多了起来.中guo越来越多的互联网公司开始正确地拥抱开源.中guo工程师在guo际开源社区的贡献和影响力也越来越大(比如.作为一个很年轻的创业公司.小米就在不到一年半的时间里推出了3个 hbase committer).这确实不是一件容易的事。但是.今天不管是在云计算、大数据还是容器等诸多开源技术领域.真正由中guo人自己主导、从零开始、自主研发、最后贡献到guo际开源社区并成为顶级开源项目的.应该就只有 apache kylinー个。 apache kylin是2013年由cbay在上海的一个中guo工程师团队发起的、基于 hadoop大数据平台的开源olap引

#############################################

资源下载
下载价格VIP专享
仅限VIP下载升级VIP
犹豫不决让我们错失一次又一次机会!!!
原文链接:https://1111down.com/224561.html,转载请注明出处

本站开启缓存功能

登入后回任何页面即可登入成功,当前页不显示

没有账号?注册  忘记密码?

社交账号快速登录