有点呆的瓜 发表于 2019-12-28 13:05:21

电子书:《构建实时机器学习系统》

1145
                       



内容简介:

构建实时
机器学习系统
河森汪涵著
燃甚
图书在版编目(CIP)数据
构建实时机器学习系统/彭河森,汪涵著一北京:机械工业出版社,2017.8
ISBN978-7-111-57557-3
L.构….①彭…②汪…I.机器学习-系统设计IV.TP181
中guo版本图书馆CIP数据核字(2017)第183687号
构建实时机器学习系统
出版发行:机械工业出版社(北東市西城区万庄大2号政码
任校对:Li秋荣
印剧:北京市荣盛彩色印刷有公司
版次:2017年8月第1版第1次印刷
开本:186mmx240mm1/16
ri张:11.25
书号:ISBN978-7~111-57557-3
定价:59.00元
如有缺页、倒页、页,由本社发行调换
010)8837942688361066
投稿热线:(010)88379604
010)683262948837964968995259读者信箱;hzit@ babool.con
北京大成律师事务所Han光/绕东
前言
机器学习从业人员的艰难选择
作为机器学习从业人员,如果今天突然被公司或学校开除,你能养活自已吗?邻居老大
妈买土鸡蛋不买神经网络模型,东门老大爷认识Guo德纲不认识朴素贝叶斯,面容姣好的“翠
花”只认房产证不认 Zookeeper。即使你身怀绝技,有着远大的抱负,机器学习应用难以赚米
也是事实。为了能维持生计,众多机器学习从业人员只能进入大公司、大组织。但限于流程
和已有的体制,在这样的工作环境下,他们很难完全发挥自己的潜能
太多的好朋友,在脱离体制和大公司的时候豪情万丈,吃散伏饭时和战友们慷慨激品
唱着真心英雄,梦想着自己也有回到北京东二环开始指点江山的一天。可是第二天带着宿降
起床面对着电脑屏幕时,却不知道该怎么开始。没错,我们都有自己的想法,我们自己就是
程序员,比那些在创业街上卖PT的人“厉害”多了。可是在工业界,不管是初人职场的新
人,还是久经沙场的老将,都需要在业余时间不停地刷题,练习" Leetcode”"中的习题,以
应对不时之需。这样的生存方式严重阻碍了知识经济的发展,更不要提为祖guo健康工作五十
年了。与大组织、巨无霸企业不同的是,自主创业往往需要开发人员全的技术能力。大公
司里面的技术能手在独立创业的时候也不免会遇到下面这些很基本的问题
口服.务.器从哪里来
以前单位、导师手里有一套自主开发的大数据平台,现在自己单干了没法用,怎么办?
口以前用的机器学习软件包是某个“牛人”自己开发的“独门武功”,只在公司内部用
现在该用什么
e北美众多巨无霸型互联网公司的面试内容类似于科举八段文,所用题目被众多从业人员总结成为一个名
Lcetcode的网站,是面试求职人员的必看网站。
口模型训练出来了,又怎么部署?
总算东拼西凑写好了一个流程,接下来如何实现数据可视化?
口总算有客户开始用了,怎么样才能对结果实时监控
这个时候你才会想起MA云的那句话:“离开公司了你什么都不是”。还是回大公
少比较安稳
总结起来,机器学习从业人员的难处有三点
口技能无法直接转化为经济效益:必须依靠大组织、公司,才能实现经济效益的转化
这必然要求从业人员服从诸多的条款和价值观,这对他们工作效率和积极性来说都是
沉重的负担
口送代速度受牵制;虽然开源社区拥有众多非常优秀的工具,但大公司、大组织往往都
有众多历史遗留架构,这使得开发部署过程变得异常漫长。与此同时,从业人员也会
觉得所学的知识将来无法为自己所用,因此感到空虚。
ロ出成果压力大:高投入就需要有高回报。机器学习从业人员薪资非常高,因此公司对
从业人员进行新架构、新项目开发的耐心往往也非常有限。就算是从公司利益出发
进行架构、代码的革新,从业人员往往也会担上不少风险。如果不能在短时间内实现
构,或者新训练的模型不能达到预期目标,从业人员的工作稳定性将会得不到保证
老板、管理人员的困境
机器学习从业人员有自己的困难,公司的老总、经理也有伤脑筋的事情。2015年
Kdnuggets T调查数据显示,工业界超过半数的数据科学家在一个职位上的工作时间一般都少
于两年。另外美guo旧金山湾区的机器学习科学家在一个职位上平均只会停留8个月。这么高
的跳槽類率让众多雇主也提心吊胆。根据笔者的经验,机器学习从业人员,从人职到真正开
始产生正现金流,至少需要9个月Zuo右的时间。太短的工作年限对于很多雇主来说远远不足
有的公司财力雄厚,高薪聘请了拥有谷歌工作经验的斯坦福大学博士,但这名博土入职
个月,文章发表了四篇,会开了五场,可是机器学习模型拿到实际工作环境中的效果却不
理想,无法上线。结果令人沮丧。
资金实力不太充裕的初创公司就更难了。本身财力有限,招人靠情怀来对冲。好不容易
找到了志同道合的人,开口就问人家要GPU集群,而现成的机器学习框架中 Tensorflow太
慢, Paddlepaddle太差,往往有一些以技术为主打的初创公司,专心于核心软件开发,而速度
太慢,结果还没开始上线产生效益,当时所在的初创公司就已经烧断了现金流
另一方面,老板从来不敢对机器学习从业人员过分施压。因为若施压太大,再加上现在
市场对机器学习专家的需求旺盛,机器学习员工都是一言不合就跳槽。施压太小,机器学习
员工就会开始面向简历的开发模式,一会儿去欧洲开会,一会儿开源个深度学习框架,就是
不上线真正能赚 钱的产品,这又怎能不让人着急
总结起来,管理人员的难处有以下三点
口双重身份的矛盾:机器学习开发人员到底算科学家还是算程序员?这是一个管理者需
要面对的根本性问题。若把机器学习开发人员看成科学家,就要做好所有投资都打水
漂的心理准备,投资回报率可能非常低;若把机器学习开发人员看成程序员,就要给
其足够的自由度和福利,并且做好开发人员冗余,对员工突然离职的情况做好准备
口利益冲突的矛盾:现在机器学习人员的流动性很高,公司需要出效益,而工作人员需
要出好看的简历。在很多情况下,这两个需求是背道而驰的。本书后文会对各种机器
学习架构进行综述,其中不乏员工为了充实简历而开发的“政绩工程”。通过对本书的
学习,相信管理人员的眼睛也会擦亮不少
口和商业部门整合的矛盾:机器学习科学家往往醉心于开发最复杂最尖端的模型,以取
得机器学习理论上的最佳效果。可是很多机器学习模型的可解释度并不好,无法让业
务部门对模型进行可视化解读。虽然机器学习工具众多,但是能将机器学习模型和可
见化系统整合起来的程序却非常少。本书所描述的架构和可视化部分会对这个向题进
总的来说,企业求生求利的动力意味着开发人员必须短平快地出结果;机器学习模型效
果的不确定性意味着管理人员必须拥抱不确定性;机器学习从业人员的高流动性意味着公司
不写寻常书,不走寻常路
什么样的技术成长道路,才能让我们施展自己的才华,同时快乐地养活自己?什么样的
职业发展模式,才能让我们真正掌握自己的命运,去改变世界,而不是为北京、上海、深圳
高昂的房价发愁?什么样的架构设计,才能让我们的生活回到朝九晚五的正常模式,能够每
天六点回家和家人吃晚餐,和心爱的人看星星看月亮
起初机械工业出版社华章公司的杨绣guo编辑联系到作者之一彭河森的时候,他是很犹豫
的。市场上现在已经有了很多优秀的机器学习著作,怎么还需要我们再写一本呢?为了验证我

#############################################


哈哈大笑 发表于 2019-12-28 13:05:26



免费下载地址:

http://pan.qqq0.com/file/488067-425779151

页: [1]
查看完整版本: 电子书:《构建实时机器学习系统》