电子书《bigdata大数据系统构建》《bigdata大数据系统构建》

电子书《bigdata大数据系统构建》《bigdata大数据系统构建》

资源下载
仅限VIP下载,请先
犹豫不决让我们错失一次又一次机会!!!

电子书《bigdata大数据系统构建》《bigdata大数据系统构建》

111

内容简介:

y技术丛书big datascos’ples and best practices ofalable realtime data systems大数据系统构建可扩展实时数据系统构建原理与最佳实践南森?马茨( nathan marz)斯.论( james w)想甚图书在版编目(cip)数据大数据系统构建:可扩展实时数据系统构建原理与最佳实践/(美)南森?马茨( nathan)磨姆斯?沃伦( james warren)著;马延辉.向辐.魏东琦译.一北京:机书名原文: big data: principles and best practices of scalable realtime data systemisbn978-7-111-55294-91.大….①南…②…③马…④向…⑤魏…i.数把处理iv.tp274中guo版本图书馆cip数据核字(2016)第262539号本书版权登记号:图字:01-2015-7585nathan marz. james wrbig data: principles and best practices of scalable realtime data systemsisbn978-1617290343original english language edition published by manning publications co.. 209 bruce park avengreenwich. connecticut 06830.copyright 0 2015 by manning publications co.simplified chinese-language edition copyright 2017 by china machine press.rights arranged with manning publications co. through watersideproductions inctransmitted in any form or by anymechanical. including photocopying. recording or any information storage and retrieval sypermission. in writing. from the publisher.all rights reserved本书中文简体字版由 manning publications co.通过 waterside productions.lnc.授权机械工业出版社在全球独家出版发行。未经出版者书面许可.不得以任间方式抄、复制节录本书中的任何郎分。大数据系统构建扩展实时数据系统构建原理与最佳实践出版发行:机械工业出版社(北京市西区百万庄大哲22号邮政码:责任编:责任校对:股虹ri刷:北京信伟业ri印刷有限公司版次:2017年1月第1版第1次印开本:186mmx240mm1/16ri]张:18.75定价:79.00元凡购本书.如有缺页、倒页、税页.由本社发行部读换投线010)88379604010)683262948837964968995259读者信箱: hzit(a haboob.com北真大成律事务所光/等邻晓东ionr!を译者序首先.请允许我们对 nathan marz致以崇高的敬意nathan marz是分布式实时计算系统 storm的创始人.在 itwitter收购社交媒体数据分析公司 backtype前担任 back type的首席工程师.之后选择离开 twitter.创立自己的公司。在实时大数据处理系统中. storm作为 apache顶级开源项目已经成为大数据界不可或缺的一部分。因此.对于能够翻译 nathan marz的书籍.我们深感荣幸与大多数程序员一样. nathan marz也是通过游戏进入开发者的世界的.在这一点上似乎我们大多数人与 nathan marz相差无几。但不同的是. nathan marz开创性地设计并使用 clojure语言编写了 storm.为我们揭开了大数据处理的新篇章.而我们未曾想过海量数据是可以实时分析并处理的.这也正是他与众不同的地方。 nathan marz对大数据概念的理解非常深刻.在编程技术上基础扎实.如同 dean jeffrey和 doug cutting那样.他用自己超凡的智慧.带领我们步入了一个全新的数据时代本书借一些虚构的社交媒体示例.来让读者深入理解以下几件事情1)什么是大数据、它们从哪里来2)社交媒体有哪些数据是有价值且需要我们去分析的3)在使用数据的过程中.我们需要用哪些思路、架构、工具来实现自己的目的4)对于不同的数据类型.我们如何选择正确的架构和模型去进行分析和挖据在翻译的过程中.我们也了解到. nathan marz不仅在数学与编程方面才华横溢.对各种开发工具与架构也是信手拈来.而且他所写的书籍也是字字珠现.文不加点。他所写的内容深邃却并不晦濯.溲显易懂.贴近实战.原作行文流畅.文采炳焕。本书将大数据方方面面的工具以实例的形式引入内容中.令人读后有一种甜畅淋漓、耳目一新的感觉.在内容方面.从 apache thrift的讲解到 lambda架构的实例、从hdfs和 mapreduce i的示范到架构和算法的实现以及针对不同类型数据模型的创建.一一涌盖其中。可以说.本书是大数据技术的集大成者.是诸多大数据书籍中难得一见的实战参考书对于我们译者来说.之所以翻译本书.既是希望将guo外实践大数据技术的重要经验引入guo内.让guo内的读者能够从中一窥究竟.同时也希望自己在翻译的过程中有所受益。站在巨人的肩膀上.才能让我们能够看得更远在本书的翻译过程中.我们得到了诸多朋友和家人的帮助、理解以及支持.在此对他们表示衷心的感谢。同时也对促成本书出版的机械工业出版社的王春华、杨福川编辑表诚挚的谢意本书内容丰富.涵盖了大数据的诸多方面.如 thrift、数据建模、hdfs、 mapreducehbase、 lambda等.这为本书的翻译增加了不少难度。尽管我们进行了多次校对和修改甚至几位译者就某些专业词汇如何准确翻译进行了多次字料句酌的讨论.但由于水平所限恐难以将原作的内容全面还原.因此也难免出现纰漏和不足。在此.也恳请广大读者在阅读之余不吝赐教.给予批评指正。2016年10月于北京er前言次进入大数据的世界佛置身于软件开发的美guo西部荒原。许多人放弃了关系型数据库.转而选择带有高度受限模型的 nosql数据库.主要是因为其使用体验良好、熟悉度较高且这种数据库可以扩展到成千上万台机器上。 nosql数据库的数量巨大堪称铺天盖地.这些数据库中很多都只有细微的差别。一个名为” hadoop”的新项目开始崭露头角.它宣称具备基于海量数据进行数据深度分析的能力。但弄清楚如何使用这些新工具很令人困惑。当时.我正试图处理所在公司面临的扩展性问题。系统架构非常复杂一一该web系统包含共享关系型数据库、队列、工作节点、主节点和从节点。数据损坏_渗.透_至数据库.为处理这些损坏.我们使用了应用程序中的特殊代码.但从节点的操作总是落后于其他节点。我决定探索其他大数据技术.看看是否有比我们的数据架构更好的设计早期的软件工程职业生涯的经历.深刻影响了我对“系统该如何架构”的观点。我的位同事花了几个星期将来自互联网的数据收集到一个共享文件系统。他在等待收集足够的数据.以便能在其上进行数据分析。有一天.在做一些ri常维护时.我不小心删除了他的所有数据.导致他的项目延期了好几周我知道自已犯了一个大错.但作为一个软件工程师新手.我并不知道这会导致什么样后果。我会不会因为粗心被解雇呢?我发了一封电子邮件向团队诚撃地道款一一让我惊喜的是.大家对此都表示非常同情。我水远不会忘记那个时刻个同事来到我的办公桌旁.拍着我的背说:“恭喜你!你现在是一个专业的软件工程师了!”他玩笑式的表述道出了软件开发中不言而喻的“真理”一一我们不知道如何创造完美的软件。软件可能有bug而且会被部署到生产中。如果应用程序可以写人数据库中.那么bug也可能写人数据库中。当着手重新设计我们的数据架构时.这样的经历深深地影响了我。我知道.新架构不但必须是可扩展的、对机器故障是可容错的.并且要易于推断故障

#############################################

资源下载
下载价格VIP专享
仅限VIP下载升级VIP
犹豫不决让我们错失一次又一次机会!!!
原文链接:https://1111down.com/224544.html,转载请注明出处

本站开启缓存功能

登入后回任何页面即可登入成功,当前页不显示

没有账号?注册  忘记密码?

社交账号快速登录