多种网盘链接检测插件 购买前,请先检测网盘链接是否有效
《ApacheKylin权威指南》_1
《ApacheKylin权威指南》_2
《ApacheKylin权威指南》_3
内容简介:
技术丛书
Apache Kylin
权威指南
ache Kylin核心团队著
Apache Kylin
机械工业出版
图书在版编目(CIP)数据
Apache Kylin权威指南/ Apache Kylin核心团队著,一北京:机械工业出版社,2017.1
ISBN978-7-111-55701-2
A….A…1.互联网络一网络服.务.器IV.TP368.5
中guo版本图书馆CIP数据核字(2016)第305395号
Apache and Apache Kylin are either registered trademarks or trademarks of The Apache Software
tion in the US and/or
implied by the
hese marks
Apache Kylin权威指南
出版发行:机械工业出版社(北京市西过
责任编辑:张梦玲
责任校对:蓝纪网
ri刷:北京信伟业印有限公司
版次:2017年1月第1版
开本:186mmx24Dmm1/
书号:ISBN978-7-111-55701-2
定价:49.00元
凡购本书,如有缺面、倒、脱页,由本社发行部调换
投稿热线010)88379604
购书热线010)683262948837964968995259读者信箱: hzit(@hzbook com
版权所
大成律事务所Han光/当东
7neew推荐序
2016年早些时候,我曾经写过一篇有关联通 Hadoop的文章,在其中的“展望篇”里谈
到过 OLAP on Hadoop的新技术 Apache Kylin。今天《 Apache Kylin权威指南》一书即将
版,我也有幸受本书作者之一Han卿(Luke)的邀请来写推荐序
联通集团的BI是2010年建设的,由于全guo有4亿用户的明细数据需要集中处理,再
加
上对移动互联网用户流量ri志的采集,使得数据量急增。截至2013年已达PB级规模,并仍
以指数级速度增长,传统数据仓库不堪重负,数据的存储和批量处理成了瓶颈。另一方面BI
上提供的面向用户的数据查询和多维分析服务,使得后台生产的Cube越来越多,几年下来
已有七八千个。用户需求对某一维度的改变往往会造成一个新Cube的产生,耗费资源不说
也为管理带来了极大的不便。2013年年底我们在传统数据仓库之外搭建了第一个 Hadoop平
台,节点数也从最初的几十个发展到了今天的3500个,大大提高了系统的存储及计算能力
为联通大数据对内对外的发展都起到了至关重要的作用。美中不足的是分布式存储和并行计
算只解决了系统的性能问题,尽管我们也部署了像Hive、 Impala这样的 SQL on Hadoop技术
但在 Hadoop体系上的多维联机分析(OLAP)却始终得不到满意的结果。 Oracle+
混搭架构还因为有对OLAP的需求而继续维持着,零散的Cube数还在继续增长
还在继续寻找奇迹方案的出现
Apache Kylin就是在这种大背景下出现在我们的视野中的。一个好的产品首先要有一
个清晰的定位,要有一套能够明确解决行业痛点的方案。 Kylin在这点上做得非常好,它
自己定义为 Hadoop大数据平台上的一个开源OLAP引擎。三个关键词: Hadoop、开源
OLAP,使它的定位一目了然,不用过多地解释。同时, Kylin也是透明的,不像许多产品把
自己使用的技术搞得很神秘, Kylin沿用了原来数据仓库技术中的Cube概念,把无限数据按
有限的维度进行“预处理”,然后将结果(Cube)加载到 Hbase里,供用户查询使用,使得
现有的分析师和业务人员能够快速理解和掌握。相比于1OE时代的Bl,它非常巧妙地使用
了 Hadoop I的分布式存储与并行计算能力,用横向可扩展的硬件资源来换取计算性能的极大
为了能够将Kyi真正融入到联通的大数据架构中,我们正在紧锣密鼓地组织系统测试
比如对单用户级的数据查询、第三方可视化工具的集成、多维Cube建立的维度数极限等的
測试。我们还计划用 Kafka来导入数据,用 Spark来加工Cube,用其他产品来代替 Hbase进
而提高数据读取性能,用 Kylin的路由选择来桥接新老Cube,等等。这时出版的《 Apache
Kyin权威指南》一书,对于我们来说无疑是雪中之炭,我们的许多疑惑都会在这本指南当
中找到权威解答。
联通公司现在经历的这些过程很多企业都会週到,“坑”我们愿意去填,路希望大家
来走。在向读者推荐( Apache Kylin i权威指南》一书的同时,我们真诚期望 Kylin(作为
Apache开源社区第一个由中guo人开发并主导的产品)能够成功,能够在不断的实践中提高自
能够充分利用中guo这个占世界数据量209?大市场,把自己打造成大数据领域的一只独
范济安
家千人计刻专家
中guo联通集团信息化部CTO
w推荐序二
我是一个开源软件的爱好者,算是开源届的一名老兵。从1995年到美guo留学起,就开
始接触开源软件,当时的GNU、 Linux、 FREEBSD和 Emacs等自由软件让刚出guo门的我感到
惊艳万分。从那时开始,我就再没有和自由软件、开源软件分开过:从读博土期间一直参与
研发自由软件XSB、因个人爱好参与贡献 GNU Emacs、在IBM工作期间基于一系列开源软
件为团队开发 Doc Book文档写作工具链,到后来在 Linkedin工作期间研究作为5个核心成
员开源的分布式实时搜索系统 Sensei,再到近几年在小米大力推动开源战略,打造基于开
源软件的小米云计算、大数据和机器学习技术及团队。20多年来,对开源软件的热爱,让我
逐渐从一名早期的自由软件爱好者、信仰者、贡献者和管理者,变成了一名坚定的开源软件
倡导者。在这期间,我见证了开源技术的萌芽、兴起和今天的繁荣,也经历了guo内外不同文
化下的开源发展历程
作为一名参与开源软件较早的中guo人,我也深深地感受到了最初西方世界对中guo人使
用开源技术、参与开源软件开发的质疑和冷落。因为互联网和自由软件进入我guo较晚,也因
为中guo人在英语上的不足和东西方文化的差异,还因为早期guo内的一些开源爱好者对开源软
件的理解不足,使得在开源方面较为领先的西方开源人土对guo人在开源上的使用和贡献存在
极大偏见。中guo开源力量融入guo际开源社区的过程是缓慢和艰苦的,幸运的是,近四五年
来,随着 Git Hub的兴起和多个开源社区的迅猛发展,中guo每年产生的计算机人才也多了起
来,中guo越来越多的互联网公司开始正确地拥抱开源,中guo工程师在guo际开源社区的贡献和
影响力也越来越大(比如,作为一个很年轻的创业公司,小米就在不到一年半的时间里推出
了3个 Hbase committer),这确实不是一件容易的事。但是,今天不管是在云计算、大数据
还是容器等诸多开源技术领域,真正由中guo人自己主导、从零开始、自主研发、最后贡献到
guo际开源社区并成为顶级开源项目的,应该就只有 Apache Kylinー个。 Apache Kylin是2013
年由cBay在上海的一个中guo工程师团队发起的、基于 Hadoop大数据平台的开源OLAP引
#############################################
|