哈哈大笑 发表于 2019-12-13 15:27:04

电子书:《PentahoKettle解决方案使用PDI构建开源ETL解决方案》

711
                       



内容简介:

??
中guo专业数据分析社区
炼数成金(www.dataguru.cn)成立于
2011年,目标是用新兴的社交网站的形
式,把各应用领域的业务专家、数据分
析专家、专家以及这些领城的从业人
员,学习者关联起来,使之能高效率地
沟通交流,帮助企业和用户能在海量数
据中寻找出价值。炼数成金社区现已成
为中guo数据分析行业从业人员主要的集
散地,业内的黄埔军校。欢迎有志者加
入我们的行列,共同将其打造为中guo最
具影响力的大数据分析垂直社交网站
Pentaho Kettle Solutions
Building Open Source ETL Solutions
with Pentaho Data Integration
Pentaho Kettle
解决方案:
Matt Casters
使用PD构建开源解决方案wm
初建军
曹雪梅
Publishing House of Electronics Industry
北京 EIJING
内容简介
本书主要介绍如何使用开源EIL工具来完成数据整合工作
本书介绍的 PDI(Kettle))是一种开源的EL解决方案,书中介绍了如何使用PDM来实现数据的削析、清洗、校验、抽
取、转换、加载等各类常见的ETL类工作
除了 ODS/DW类比较大型的应用外, Kettle实际还可以为中小企业提供灵活的数据抽取和数据处理的功能。 Kettler除
了支持各种关系型数据库、 Hbase、 Mongodb这样的 NOSQL数据源外,它还支持 Excel、Aces这类小型的数据源。并且
通过插件扩展, Kettle可以支持各类数据源。本书详细介绍了 Kettle n可以处理的数据源,而且详细介绍了如何使用 Kettle
抽取增量数据
Kettle的数据处理功能也很强大,除了选择、过滤、分组、连接、排序这些常用的功能外
le里的Java表达
式、正則表达式、Java本、Java类等功能都非常灵活面强大,都非常适合于各种数据处理功能。本书也使用了一些篇
幅介绍 Kettler这些灵活的数据处理功能。
本书后面章节介绍了如何在 Kettle上开发插件,如何使用 Kettles处理实时数据流,以及如何在 Amazon AWS上运行
Kettle等一些高级主题。
除了介绍 PDI(Kettle)工具的使用和功能,本书还结合 Kimbal博土的数据仓库和ETL子系统的理论,从实践的角度介
绍数据仓库的模型设计、数据仓陸的构建方法。以及如何使用PDI实现 Kimball博士提出的34种ETL子系统
Pentaho Kettle Solutions: Building Open Souroe ETL Solutions with Pentaho Data Integration
Onginal English Edition Copyright o 2010 by Wiley Publishing Inc.
Authored Translation of the Eton published by Wiley Publishing, Inc. Indianapolis, Indiana.
No part of this book may be reproduced in any form without the written permission of Wiley Publishing, Inc.
Copies of this book sold without a Wiley sticker on the back cover are unauthorized and illegal.
文版专有出版权由 Wiley Publishing, Inc投予电子工业出版社。专有出版权受法律保护
有 Wiley Publishing,e防锈标签,无标签者不得销售
同登记号图字:01-20140
图书在版编目(CIP】数据
Pentaho Kettle解决方案:使用PDI构建开源ETL解决方案/(美)卡斯特( Casters. M),(美)布曼( Bouman,R),(美)东恩
( Dongen,V.)著;初建军,曹雪梅译.一北京:电子工业出版社,20143
书名原文: Pentaho Kettle Solutions: Building Open Source ETL Solutions with Pentaho Data Interation
ISBN978-7-121-2245-4
I.①PⅡ.①ド…②布…③东④初…⑤曹….①数据库一技术N.①TP311.13
中guo版本图书馆CIP数据核字(2014)第021514号
策划编辑:张月萍
责任编辑:贾莉
印:北京中新伟业印明有限公司
装订:三河市良远印务有限公司
出版发行:电子工业出版社
北京市海淀区万寿路173信箱
Qiu编:100036
开本
字数:832千字
印次:2016年8月第4次印
定价
凡所购买电子工量出版社图书有缺问题,请向购买书店调接换。若书店售缺,请与本社发行部联系,联系及郎购电话:(010)
88254888,88258888
质量投诉请发郎邮件至z@phei.com.m,瓷版侵权举报请发郎件至boggciphei.com.cn.
本书咨询联系方式:010-5126088819 fag phei com. en
用户体会
报表管理是销售管理的一项重要工作,面对70多个guo家合作伙伴的不同种类型的销售报
如何通过自动化手段进行格式统一、计算和分发,是我2009年在新兴市场集团工作时的
痛点”是我特别想实现的,而这套方案必须要基于开源的方案来控制开发及未来维护的
Jason给我推荐开源的ETL工具 Kettle来完成这个工作,他使用 Kettle j加上开源的报表工具
Jasper,用了两个月的时间就把这套系统实现并上线了:
它可以自动从各个数据源获取数据、自动生成 Excel:报表,并自动投送到相关业务人员的邮
箱里,这节省了我三个做报表的人力!而且数据更及时、准确!非常了不起!!
赵海生
客户数据与市场秩序总监
联想集
数据是投资的重要基础,但由于数据量大且指标较多,从各种不同格式的报告中摘取我们
希望的数据一直是让我们头疼的事情。这一事情的改观发生在2011年 Jason为我们带来 Kettle工
具之后,经过几个月的开发和测试,我们的指标自动抓取系统正式上线并一直沿用至今,它能
从各种格式的报告中摘取重要的数据,这些数据形成我们分析的基础。实际上,这只是使用了
Kettle工具的一小部分功能而已,相信在数据抓取和处理领域,我们还将有更多的合作机会
从2011年就听到 Jason要翻译本书的计划,很高兴能看到这一目标最终实现,这是 Jason本人的
一个里程碑,也是让更多的人受益于Kcle工具的一次契机,视ason和Kele的路都越走越宽
北京中能兴业投资咨询有限公司
IV a Pentaho Kettle解决方案:使用Pの构建开源上解决方案
概《企业果构的角度来看,和传统的编写代码相比,ET工具在开发实施效率(包括代码复
低出错率、可维护性上绝对都是巨大的进步。我个人相信在企业ETL领域,编程
语言的工作未来可能会减少到总任务量的10??下90?需要借助ETL工具来实现
本书和市面上林林总总的介绍ETL工具的书籍不同。书籍的原作者Mat是 Kettle的核心设计
与开发者( Kettle的灵魂所在),而且 Jasoni带领的团队对Kctl的源代码有深人的了解,并有
丰富的实践经验,他们对本书所涉及的主题有切身的体会,这样可以最大限度地避免出现很多
计算机译本图书出现的读者“不知所云”的情况。本书亦可以看作是 Jason在guo内不遗余力推广
Kettle ETL解决方案的又一个里程碑。
葛兰素史克(中guo)投资有限公司 Enterprise Architect
数据对于每个企业来说都是极其重要的,它蕴含的价值不可限量,尤其是对于我服务的电
信行业。我们做ETL工作先是自己开发程序或者存储过程,后来慢慢转型使用ETL工具,深刻体
会到工具对于生产力发展的重要性
随着对ETL的认识越来越深入,要求也越来越高,尤其是一些企业特定的需求即使是顶级的
商业ETL软件也无法满足。在2012年一次偶然的机会我认识了 Jason/从而认识了 Kettle,在 Jason的
帮助下仅用了三天时间就开发出一个定制化的组件,解决了长期困扰我们的问题, Kettle本身的
灵活性、扩展性再加上 Jason的团队对这款软件的驾取能力,都是我们公司所需要的
在得知 Jason要翻译此书时,真的非常期待并衷心祝愿 Jasoni和 Kettle在中guo能有更好的发展
黄磊
上海理想信息产业(集团)有限公司B!架构师

#############################################


蝶舞櫻婲落 发表于 2019-12-21 19:54:32



免费下载地址:

http://pan.qqq0.com/file/488067-425771554

页: [1]
查看完整版本: 电子书:《PentahoKettle解决方案使用PDI构建开源ETL解决方案》