多种网盘链接检测插件 购买前,请先检测网盘链接是否有效
《Hadoop 2.X HDFS源码剖析》_1
《Hadoop 2.X HDFS源码剖析》_2
《Hadoop 2.X HDFS源码剖析》_3
内容简介:
徐鹏
2005-2012年在北京邮电大学完成本科以
及硕士的学习,目前就职于今ri头条担任
基础架构研发工程师。长期关注大数据处
理、分布式系统的研究以及 Hadoop相关
技术的应用与开发
Hadoop 2X
HDFS源码剖析
徐鹏著
電子工業出版料
Publishing House of Electronics Industry
北京 BELJING
本书以Hp260吗为基础,深入剖析了HDFs2X中各个模块的实现细节,包括.R.P.C.框架实现
Namenode实现、 Datanode实现以及HDFs客.户.端实现等。本书一共有5章,其中第1章从总体上介绍了HDFs
时详细介绍了HDFS各个组件间.R.P.C.接口的定义。第2章介绍了 Hadoop .R.P.C.
框架的实现, Hadoop .R.P.C.是HDFS各个组件间通信所依赖的底层框架,可以理解为HDFs的神经系统
第3-5章分别介绍了 Namenode、 Datanode以及HDFS客.户.端这三个组件的实现细节,同时穿插介绍了
HDFS2X的新特性,例如 Namenode HA、 Federation Namenode等
阅读本书可以帮助读者从架构设计与源码实现角度了解HDFS2X,同时还能学习HDFS2X框架中优秀
的设计思想、设计模式、Java语言技巧以及编程规范等。这些对于读者全面提高自己的技术水平有很大的
帮助
未经许可,不得以任何方式复制或抄袭本书之部分或全部内容。
版权所有,侵权必究
ROH
图书在版编目(CP)数据
Hadoop2 X HDES源码剖析/徐鹏著.一北京:电子工业出版社,2016.3
ISBN978-7-121-28155-6
I.①H…Ⅱ.①徐…Ⅲ.①分布式文件系统一研究Ⅳ.①TP316
中guo版本图书馆CP数据核字(2016)第027311号
策划编辑:张春雨
责任编辑:葛娜
印刷:三河市双峰印刷装订有限公司
装订:三河市双峰印刷装订有限公司
出版发行:电子工业出版社
北京市海淀区万寿路173信箱邮编:100036
开本:787×9801/16印张:3525字数:879千字
版次:2016年3月第1版
印次:2016年3月第1次印刷
定价:10800元
凡所购买电子工业出版社图书有缺损问题,请向购买书店调换。若书店售缺,请与本社发行部联系,联
系及邮购电话010)88254888
质量投诉请发邮件至ats@phei
盗版侵权举报请发邮件至dbqqaphei.com.cn
服务热线010)88258888
献给远老师,愿正年轻的你,永远保持一颗对世界好奇的心
献给我的父母、妹妹,我无法用语言表达对你们的爱,以及你们对这个家庭默
默付出的感恩
前言
今天 Hadoop经成为大数据处理中十分重要的平台,一个以Hadp为基础的活跃的开
源生态圈已经逐步形成, Hadoop的应用也由最初的互联网行业发展到金融行业、电信行业
IT设备商以及数以万计的中小企业。 Hadoop的HDFS组件(Hado分布式文件系统)以及
MapReduce组件分别为上层框架提供了分布式存储和计算的能力
HDFS作为 Hadoop中解决分布式存储的基础组件,最早是根据GFs( GuGe File System)
论文的概念模型来设计实现的。然而,随着HDFS上层框架的丰富以及应用场景的扩展,用
户对HDFS的功能、性能、稳定性、扩展性以及可靠性的要求越来越高,HDFS2X版本也就
应运而生,相对于HDFS1X,HDFS2X版本提出了很多振奋人心的新特性,如 Namenode HA
Federation Namenode、集中式缓存、快照等。但令人惋惜的是,至今还没有一本能够深入剖
析HDFS2X内部实现细节,以及介绍HDFS2X新特性的书籍。本书的出现填补了上述空白
它是guo内第一本深入剖析HDFS2X源码实现的书籍
B,书以Hdop260源码为基础,深入剖析了HDs2X中各个模块的实现细节,包括
Datanode实现以及HDFS客.户.端实现等。阅读本书可以帮
助读者从架构设计与源码实现角度了解HDFS2X,同时还能学习HDFS2X框架中优秀的设
计思想、设计模式、Java语言技巧以及编程规范等。这些对于读者全面提高自己的技术水平
有很大的帮助
如何阅读本书
由于篇幅原因,本书并没有介绍HDFS实现中的一些基础知识,例如 Java nic、动态代
理、 protobuf等。而是直接切入源码分析HDFS的设计与实现,同时介绍了一些经典的设计
模式、Java语言技巧在HDFS实现中的应用。希望读者在阅读本书之前,先搭建好源码环境」
并了解相应的基础知识,这样学习效果会更好。
本书一共有5章,相互之间的联系比较紧密,有联系的小节都有注释标注,读者可以根
据注释跳跃阅读。
第1章是HDFS概述,从总体上介绍了HDFS的组件、概念以及典型的流程,同时详细
介绍了HDFS各个组件间.R.P.C.接口的定义。由于HDFS流程大都比较复杂,往往涉及多个组
件的配合,读者在阅读后续的具体章节时,可以查阅本章内容获取某个流程的总体描述,以
#############################################
|