电子书:《spark:大数据集群计算的生产实践》《spark:大数据集群计算的生产实践》

电子书:《spark:大数据集群计算的生产实践》《spark:大数据集群计算的生产实践》

资源下载
仅限VIP下载,请先
犹豫不决让我们错失一次又一次机会!!!

电子书:《spark:大数据集群计算的生产实践》《spark:大数据集群计算的生产实践》

111

内容简介:

spark: big data cluster computing in productionspark大数据集群计算的生产实践[美] ilya ganelin[西] ema orhan[ri] kai sasaki[美] brennon york著李刚译周志湖审校publishing house of electronics industry北京· beijing

内容简介本书涵盖了开发及维护生产级 spark应用的各种方法、组件与有用实践。全书分为6章.第1~2章帮助读者深入理解 spark的内部机制以及它们在生产流程中的含义:第3章和第5章阐述了针对配置参数的法则和权衡方案.用来调优 spark.改善性能.获得高可用性和容错性:第4章专门讨论 spark应用中的.安.全.问题;第6章则全面介绍生产流.以及把一个应用迁移到一个生产工作流中时所需要的各种组件同时对 spark生态系统进行了梳理本书不会讲述入门级内容.读者在阅读前应己具备 spark基本原理的知识。本书适合 spark开发人员、park应用的项目经理.以及那些考虑将开发的spk应用程序迁移到生产环境的系统管理员(或者spark: big data cluster computing in production. 978-1-119-25401-0. ilya ganelin. ema orhian. kai sasaki.brennon yorkcopyright o 2016 by john wiley sons. inc. indianapolis. indianaall rights reserved. this translation published under licenseno part of this book may be reproduced in any form without thecopies of this book sold without a wiley sticker on the back cover are unauthorized and illegal本书简体中文字版专有翻译出版权由美guo john wiley&sons.hne.公司授予电子工业出版社。未经许可.不得以任何手段和形式复制或抄袭本书内容本书封底贴有 john wiley&sons.nc.防伪标签.无标签者不得销售版权贸易合同登记号图字:01-2016-6363图书在版编目(c|p)数据spak:大数据集群计算的生产实践/(美)伊利亚·甘列林( ilya ganelin)等著:李刚译.一北京:电子工业出版社.20175书名原文: spark: big data cluster computing in productionsbn9787-121-31364-6①s…ⅱ.①伊…②李…ⅲ.①数据处理软件ⅳ.①tp27中guo版本图书馆cp数据核字(2017)第077641号责任编辑:许艳印刷:北京天宇星印刷厂装订:北京天宇星印刷厂出版发行:电子工业出版社北京市海淀区万寿路173信箱邮编:100036开本:787×9801/16印张:13.75字数:226.5千字版次:2017年5月第1版印次:2017年5月第1次印刷定价:6500元凡所购买电子工业出版社图书有缺损问题.请向购买书店调换。若书店售缺.请与本社发行部联系.联系及邮购电话010)8825488质量投诉请发邮件至zts@phphei. com. cn.盗版侵权举报请发邮件至[email protected]本书咨询联系方式:01059. faq@phei

关于作者ilva ganelin从机器人专家成功跨界成为一名数据工程师。他曾在密歇根大学花费数年时间硏究自发现机器人( self-discoveringrobot).在波音公司从事手机及无线嵌入式dsp(数据信号处理)软件开发项目.随后加入 capital one的数据创新实验室.由此进入大数据领域。iya是 apache spark核心组件的活跃贡献者以及apache apex的提交者( committer).他希望研究构建下一代分布式计算平台。同时.ia还是一个狂热的面包烘焙师、厨师、赛车手和滑雪爱好者ema rhian是一位对伸缩性算法充满激情的大数据工程师她活跃于大数据社区.组织会议.在会上发表演讲.积极投身于开源项目。她是 jaws-spark-sql-rest( sparksql数据仓库上的一种资源管理器)的主要提交者。ema一直致力于将大数据分析引入医疗领域.开发一个对大型数据集计算统计指标的端到端的管道

ⅳ spark:大数据集群计算的生产实践kai sasaki是一位ri本软件工程师.对分布式计算和机器学习很感兴趣。但是一开始他并未从事 hadoop或 spark相关的工作.最初的兴趣是中间件以及提供这些服务的基础技术.是互联网驱使他转向大数据技术领域。kai-直是 spark的贡献者.开发了不少mlib和ml库。如今.他正尝试研究将机器学习和大数据结合起来。他相信 spark在大数据时代的人工智能领域也将扮演重要角色。他的ghb地址为:htps://github.com/lewuathebrennon york既是一名特技飞行员.也是一位计算机科学家他的爱好是分布式计算、可扩展架构以及编程语言。自2014年以来.他就是 apache spark的核心贡献者.目标是通过发展 graphx和核心编译环境.培育一个更强大的 spark社区.激发更多合作从为 spark提交贡献开始.york就一直在用 spark.而且从那个时候开始.就使用 spark将应用带入生产环境。

关于技术编辑ted yu是 horton works公司的资深工程师.也是 hbase pmc以及spak的献者。yu在 spark领域有不少经验dan osipov是 applicative.llc的首席技术顾问.有两年的 spark工作经验.四年 scala开发经验.主要从事数据工具及数据应用方面的工作。他曾参与移动开发及内容管理系统项目eff thompson是从神经学跨界过来的数据科学家.获得加州大学伯克利分校视觉科学(主要为神经系统科学及脑显像)博士学位.在波士顿大学生物医学影像中心读完博士后。在工作的头几年.jeff在美guoguo内一家.安.全.领域创业公司工作.职责是作为算法工程师构建下一代货物检查系统。最近两年他一直在博世公司(一家全球性的工程和制造公司)担任高级数据科学家anant asthana是 pythian公司的大数据顾问及科学家。他在设备驱动器及高可用/临界负载的数据库系统领域有较深研究① hortonworks这个名字源自儿童书中一只叫 horton的大象。2011年.雅虎剥离 hadoop业务由 eric bladeschweiler.雅虎主导 hadoop开发的副总裁.带领二十几个核心成员成立hortonworks。成立伊始. hortonworks即获雅虎和 benchmark2300万美元的投资.可谓含着银汤匙出生。此后 hortonworks一直受到资本市场追捧.ipo前一共获得五轮共计248亿美元的融资.并于2014年底登陆纳斯达克。—译者注

#############################################

资源下载
下载价格VIP专享
仅限VIP下载升级VIP
犹豫不决让我们错失一次又一次机会!!!
原文链接:https://1111down.com/223091.html,转载请注明出处

本站开启缓存功能

登入后回任何页面即可登入成功,当前页不显示

没有账号?注册  忘记密码?

社交账号快速登录