ydddg 发表于 2019-12-31 13:18:57

电子书:《相关性搜索利用Solr与Elasticsearch创建智能应用》

1243
                       



内容简介:

内容简介
本书揭开了相关性搜索的神秘面纱,告诉大家如何将 Elasticsearch与Solr这样的搜索引擎作
为可编程的相关性框槊,从而表达业务排名规则。从这本书中你可学会如何结合各种外部数据源
分类方法以及文本分析手段对相关性进行编程,以满足用户的个性化需求,将令人满意的搜索结
果呈现给用户。此外,相关性搜素也需要一定的软性技能。本书还将告诉读者怎样与业务人员协作
为业务找到正确的相关性需求,从而在搜索产品的整个研发生命周期内,实现相关性改进的良性
语环。本书介绍了搜素引的基本原理,及相关性搜素的调试技术,用大量实例的方式详述了搜
素引的诸多特性,以形成一整套针对相关性搜素的系统化方法,并倡导致力于提高搜素质量的
企业文化
本书适用于想利用 Clasticsearch或sor尝试构建智能搜索应用的开发人员
Onginal English Language edition published by Manning Publications, USA. Copyright
Manning Publications, Simplified Chinese-language edition copyright o 2017 by Publishing House of
Electronics Industry. All rights reserved
本书简体中文版专有出版权由 Manning Publications授予电子工业出版社。未经许可,不得以
任何方式复制或抄羲本书的任何部分。专有出版权受法律保护
版权贸易合同登记号图字:01-2016-7239
图书在版编目(CIP)数据
相关性搜索:利用sor与 Elasticsearcht创建智能应用/(美)道格?特恩布尔( Doug Tumbull
(美)约·贝瑞曼( John Berryman)著;莫映,蔡宇飞,股智勇译,一北京:电子工业出版
社,2017.10
书名原文: Relevant Search: With applications for Solr and Elasticsearch
ISBN978-7-121-32721-6
.①道…2约…③莫…④蔡…5股…m.①搜索引擘一程序设计N.①TP3913
图书馆CIP数据核字(2017)第228614号
策划编辑:许艳
责任编辑:Liu舫
印刷:北京天宇星印刷厂
出版发行:电子工业出版社
北京市海淀区万寿路173信箱邮编:100
开本:787x9801/16
印张:24.5字数:439千字
版次:2017年10月第1版
印次:2017年10月第1次印刷
定价:99.00元
凡所购买电子工业出版社图书有缺损问題,请向购买书店调换。若书店售缺,请与本社发行
部联系,联系及邮购电话:(010)8825488,882588
质量投诉请发郎件至zlts(aphei.com.cn,盗版侵权举报请发邮件至dbq(@phei.com.cn
本书咨询联系方式:010512608889faq(aphei.com.cn
译者序
与本书结缘还要追湖到一年前。当时正值团队启动新产品的研发,需要一款
查询性能优良的 NOSQL DB作为数据存储方案。在考察了包括 Elasticsearch、Solr
Mongo、 Cassandra等一系列 NOSQL DB之后,我们最终从实际需求
选择了与
产品功能契合度更高的 Elasticsearch.于是大家开始了对 Elasticsearch从零起步的探
素。不过,在阅读了 Elasticsearch的大量官方文档之后,大家发现,虽然通过文档
的查阅可以了解 Elasticsearch诸多特性的使用方法,但是这种工具书式的平铺直叙
无法将知识有机地联系起来,形成系统而立体的认知。并且,在阅读官方文档的过
程中我们也发现,自己对不少搜索相关的基础概念还不甚了解,于是只能借助于网
络上搜到的一些支离破碎的快餐资源来补充营养
为了解决这一问题,大家觉得团队成员们追切需要一本良师益友式的专业书
籍,它既能系统地介绍搜索的相关知识,又能结合当下流行的搜素引擎框架
到理论与实践相结合。恰巧,电子工业出版社计算机出版分社的许艳老师联系到
了我们,商讨一本刚从 Manning出版社引进的外版书籍的翻译工作,该书正是以
Elasticsearch和solr为背景介绍相关性搜索的。而且,此书引进时刚刚面世不久
在亚MA逊上甚至还没有开始售卖,因此所涉内容的时效性非常之高,正好是团队眼
下急需的学习资源。于是,几位同事商量之后,党得在学习之余,如果顺手将其译
成中文,以惠及更多的业内同行,不失为一件利人利己的好事。故而,オ有了读者
眼前的这本中文版图书。
遇到本书是译者的幸运。书中围绕相关性搜索这一主题,全面系统地介绍了该
领域的方方面面:从搜索引擎的基础知识,到相关性搜索的主要技术,再到各种高
阶议题,直到当下前沿领域的研究成果,凡此种种,不一而足。两位作者通过朴实
细腻的笔触,清晰无误的语言,循序渐进地将我们带入了相关性搜索的神奇世界
这里没有高深莫測的晦涩理论,只有生动有趣的示例讲解。值得一提的是,全书各
译者序
章所选的示例多以构建影片搜索应用这一任务为背景,一以贯之,精挑细选。通过
来自 The Movie Database(TMDB)的大量真实影片数据,为读者构建出了一个个实
际可运行的搜素示例。其中,以经典系列影片“星际迷航”为主题的影片搜索应用
就在本书的前后多个章节中频频出现,足见作者构思精巧,用心良苦。读完本书
再读 Elasticsearch或sor的有关文档或书籍时,其中内容无一不有似曾相识的感觉
查阅其他介绍相关性搜索的文章,也有一种“一览众山小”的感觉。而面对现实生
活中的各种应用,以及我们自己研发的产品,不禁让人联想,如果将书中所学应用

其中,想必一定能画龙点睛,为之增色不少
本书的翻译过程持续了将近十个月,中文版的字里行间都饱含了几位译者的辛
勤汗水。回顾往昔,多艰之旅,历历在目,译稿最终得以成功付梓,实属不易。翻
译过程中,从初译到终稿,每一章每一节基本都要经过反复推敲与琢磨至五六遍以
上。因为是多人翻译,所以为了保证全书行文风格的统一,最后还进行了一次全面
细致的统稿,几位译者都为此投入了极大的精力和时间。大家已经记不清有多少个
ri夜,当家人都已进入梦乡,自己却还在灯下埋首伏案:有多少个周末,把孩子托
付给爱人照料,自己却在一旁奋笔疾书
本书的翻译也是一次感恩之旅。感谢家人和朋友,没有他们一直以来的支持就
不会有本书中文版的问世。感谢莫映的夫人Li唯一女土,作为本书的首位读者,每
每译稿新鲜出炉,都会经过她的耐心初校,以读者的视角为我们提出诸多中肯的修
改建议。感谢智勇的家人,本书翻译之初正值智勇千金呱弧堅地,家人的理解和支
持是这位新晋奶爸最大的前进动力。感谢字飞的爱女,小小年纪就善解人意,能够
体谅妈妈因为工作而少了与之相伴的时间。还要感谢博文视点的许艳老师,为我们
牵线搭桥,感谢责编Liu舫老师,为本书的后期审校尽心尽力。也要感谢我们这几位
译者彼此间的相互扶持。大家利用各自的业余时间,以极大的热情投入到翻译工作
中,默契配合,一路走来。当然,更应感谢本书的两位原作者 Doug Turnbull先生和
John Berryman先生,他们的春智与经验成就了本书原作的好口碑
最后,希望中文版的面世,不负原作的美誉,以及各位读者的厚望!
中文版译者
2017年8月于北京,睛耕书斋
推荐序
在过去十年里,搜索已经变得无处不在一一关键字搜索框已经演变成查找数据
和润览大多数网站及应用的事实上的标准用户界面。与此同时,对大多数组织来说
若非被严重忽视,要想提供真正具有相关性的搜索体验一直以来都绝非易事
强大的开源技术已经能做到在几乎零编码的情况下(如 Apache Solr和
Elasticsearch),以分布式的、高度可伸缩的方式,实现高效运行和功能丰富的搜索(
Apache Lucene)。这为几乎所有的开发人员在大数据时代建立起一个“在一般意义
上相关( generally relevant)”的实时搜索引擎提供了必要的基础架构。随着搜索在
基础架构方面有越来越多的难题得到了解决,加之解决方案的商品化_进.程_,竟争的
差异已经从如何提供快速、可伸缩的搜索,转变成如何针对用户的信息需求提供最
为相关的匹配。换言之,提供“在一般意义上相关”的结果已经远远不够了一一谷
歌以及其他顶级的搜索引擎现在已经把用户培养成为这样一种群体,他们期望搜索
应用几乎能读懂自己内心的想法。本书所讨论的,就是我们如何更加积极地朝着理
解用户意图的方向去努力
Doug Turnbull 7和 John Berryman是两位经验丰富的搜索和相关性领域的专家
我认识他们已经很多年了,大家时常会在出席搜素大会时遇到。我还能回忆起与他
们一起讨论的美好时光,我们共同探讨了如何解决搜索相关性、推荐和个性化方面
的一些世界级难题。没有人会比我更加欣喜地看到他们将自己独特的专业知识融入
这本书中一一这是我读过的最好的、最引人入胜的技术书籍之
相关性调优是一大难题一一它经常被误解,而且当出现错误时,往往不会立即
显现出来。为了识别出有问题的模式,我们通常需要看到许多错误的样例才行,并
且在没有真正看到结果显示的情况下,要想知道什么才是更好的调优结果往往很困
难。遗憾的是,通常一个搜索系统直到被部署到生产环境之后,组织才开始意识到
默认提供的相关性和真实的、受领域驱动的、个性化匹配之间存在的差距
不仅如此,那些处理相关性所需的技能(如领域专长、特征工程、机器学习
本体理论、用户测试、自然语言处理等)与那些构建和维护可扩展的基础架构所需
的技能(如分布式系统、数据结构、性能和并发、硬件利用率、网络传输和通信等)
也是非常不同的。相关性技术工程师这一角色在许多组织中几乎完全缺失,从而给
我们留下了许多未曾发掘的潜力,可以营造出真正让用户满意、并显著推动公司发
展的搜索体验
从手动输入关键字进行搜索到完全自动化的推荐,这一范围内的各种不同程度
的个性化,也给我们带来了许多机会,可以为每一位用户的特定需求提供相关性匹
配。本书作者相当出色地解释了对搜索特征或信号进行建模时各种方法间的细微差
别,从而充分利用了这一范围内的各种不同程度的个性化。掌握了本书中介绍的技
术,我们就可以很好地胜任相关性技术工程师的角色,并能够解决在创建真正个性
化的相关搜索体验时遇到的许多最具挑战性的问题。
Trey Grainger
Solr in Actionー书的作者
Lucidworks技术部高级副总栽



月半小夜曲 发表于 2019-12-31 13:19:01



免费下载地址:

http://pan.qqq0.com/file/488067-425781873

页: [1]
查看完整版本: 电子书:《相关性搜索利用Solr与Elasticsearch创建智能应用》