马毅人工智能
① 互联网企业究竟如何校招
夏末秋初,年复一年,距离新一季校园招聘的拉开大幕已有些日子。可以肯定,与去年一样,被这个时代聚光笼罩的互联网行业,依旧是不少莘莘学子踏出校门的不二之选——智联招聘发布的《2016年应届毕业生就业力调研报告》显示,去年近三成毕业生进入互联网行业(后者平均月薪也最高),当所谓“互联网+”有如围城一般嫁接着那些“传统”与“新贵”,对人才的渴求只会更旺。
时至今日,没人会忽视人才之于一家企业——尤其处于外部环境剧烈变动的互联网企业的地位高企。与工业时代资本之于资源分配的地位不同,人与公司的位置正在发生迅速反转,正如吴军先生所言:“今天全世界最值钱的,最创造价值的企业都是轻资产的——企业价值体现在它所拥有的人。盖茨曾经讲,即使微软全部的大楼和看得见的资产都被拿走或者毁掉,只要人在,很快就能东山再起。”
也因如此,当媒体在描述那些备受尊敬的企业运营策略时,花多少心血用于招聘是个日趋代表正确的决策,谷歌首席人才官拉斯洛·博克在《重新定义团队》中就写道:他们把人力资源费用集中用在招聘而非培训上,因为一个最优的人才能胜过300个普通人。
尤其是那些优秀的年轻人。谁都知道,在置身于时代前沿的互联网行业,年轻人脑中的新锐想法即是资本本身,而所谓“白纸一张”的反面,在优秀的雇主看来,实则意味着更强的可塑性和忠诚度。
当然了,任何一类群体,优质人才都有着的稀缺性。良禽择木而栖,对互联网雇主来说,校招可谓一场全无硝烟的战争——就像他们在商业竞争中的常态,诚意与技巧同样适用于对优质校招生的争夺,而企业基因的差异,让他们有着不一样的招聘风格。
今天就来说说科技巨头们校招这件事。
左手情怀,右手娱乐
谈及企业与学生的第一次亲密接触,宣讲是必不可失的一环。长久以来,宣讲已被企业摸索出一条行之有效的通路,美国《大西洋月刊》撰稿人路易斯·切斯洛就曾指出:通常情况下,科技企业一开始会讲他们的“创业故事”,让听众重新回到那个艰苦年代,然后一般会阐述自己的“成长史”,谈谈公司的扩张脚步。
对于有着良好口碑的科技巨头,上述路径无疑颇具感召力。譬如,华为今年校招主题即是“勇敢新世界”,作为一家受人尊敬的本土企业,他们为校招拍摄的微电影情怀满满,而宣讲内容上,二十余年从跟随者成为ICT行业领导者的故事,对学生们而言无疑非常受用。
而感召同样可以来自创始人的故事和寄语。不久前,今日头条张一鸣写的一篇《我遇到的优秀年轻人的5个特质》在朋友圈刷屏,他从个人经历谈到了其眼中优秀年轻人的特质——也间接表述了今日头条对学生的期许,读来“导师范儿”十足。
当然,除了“情怀”,深谙年轻人网络话语体系的互联网品牌,同样会以刻意“讨好”的方式博得校招生注意。譬如,网易就为2017校招特意改编了一首名为《浙江杭州网易互联网招聘了》的神曲,鬼畜风格引来刷屏式的传播效果,在情怀当道的校招市场,以一种另类方式博得受众眼球。
同样深谙此道的还有滴滴。拉勾网CEO马德龙指出,今年校招市场,美团点评和滴滴这样的独角兽同样受到青睐。而将今年校招主题定为“定义下一个未来”的滴滴,也制作了一首魔性十足的视频,并将公司愿景等“套路”内容融入视频的欢快之中,也算颇为讨巧。
总之,一手情怀,一手娱乐,是不少互联网企业招揽学生的两大利器。
网络:技术驱动,价值先行
当然了,谈及校招,对学生们而言最诱人的名字无疑是BAT,媒体也愿将更多笔墨挥洒到他们的薪资待遇中,而容易被忽视的是,其实他们的校招方式往往更富有层次。
先看B,今年校招争夺战中,网络可谓是三家中出拳最立体也最精准的一个。一方面,网络今年继续加强了技术驱动的务实作风,相比其他企业更多对于感性层面的诉诸,网络更强调用技术实力说话,在各地的校园宣讲中对人工智能、语音合成、自然语言处理、无人车等前沿技术进行了详细展示,技术领域的“大秀肌肉”和人才培养的不遗余力,无疑是笼络优秀技术人才的绝佳手段。
除了对技术信仰的“布道”,网络今年还在企业文化吸引力上卯足了功夫。这一点从网络的品牌调性塑造上就可见一斑,今年网络将校招主题定义为“在这里,做自己”显然契合了90后群体表达自我、彰显个性的心理,而在校招过程中,网络也尤为注重对用户需求的满足,比如站在学生的视角进行宣讲,邀请师哥师姐分享网络故事,在微博微信平台实时答疑等等,更让人眼前一亮的是网络校招今年还推出了不少多变但务实的新玩法,比如迎合年轻群体观看习惯的“直播面试”活动,首次直播就吸引了20万人在线观看,在帮助求职者提前了解面试流程和企业文化的同时,也向外界传递出网络对人才招纳的开放态度。
再如网络在今年笔面试环节增加“文化价值观测试”,通过真实场景还原和开放性的试题,让求职者在选择中更好地了解自身特点、评估自己是否喜欢和适应网络的工作。测试后发放的趣味漫画网络“文化价值观秘籍”,完全颠覆了企业文化教条口号式的宣传桎梏,把目光转向寻求求职者内心的真正认同,事实上,“简单,可依赖”的网络文化和充满校园气质的工作环境也确实引发了毕业生们的集体共鸣。显然,这种求同存异、双向选择的招聘形式博得了不少90后求职者的好感,价值先行的做法也在很大程度上降低了企业“试错”的成本。
“务实”的阿里与“产品经理”腾讯
再来看看阿里。
我个人觉得,在BAT今年校园招聘中,某种程度上阿里或许是最“务实”的一个。
由于集团人才战略调整,从去年开始,阿里巴巴校招就本着更为严格的“优中选优”原则——尤其到了招聘季,你经常能在网上看到如游戏闯关一般的“阿里巴巴招聘攻略”。早在今年7月中旬,阿里巴巴就宣布启动2017秋招,将“非凡人做非凡事”定位为人才战略的阿里,今年校招仍旧选择“优中选优”的原则——谁都知道,阿里校招的笔试题颇为艰难(我就看到知乎上不少人都在讨论),而据阿里校招负责人定净介绍,今年的笔试题会比往年更难,还将引入人脸识别技术来防止作弊。总之,“务实”的阿里在甄别未来精英的人选上,确实费了不少功夫。
最后来说说腾讯。
相比于网络的“立体”与阿里的“务实”,倘若归纳腾讯今年校园招聘的关键词,也许就是:“产品”。用腾讯雇主品牌负责人马毅的话说,鹅厂是在“用产品思维做校招”。
举个例子,谁都知道用户参与之于产品的重要意涵,而腾讯同样将这种参与度搁置在了招聘上,譬如,腾讯在大概30多个目标院校建立了微信群,拥有一个完整的运营团队,深入每个微信群了解学生说了什么,并及时反馈,做战略上的调整。除此之外,马毅介绍:“我们还做了一款APP叫‘有聊’,就是一个公司内和公司外的人的问答交互平台。所有参加鹅厂校招的人下了这个APP提的问题,内部员工会对问题做定点回答,这个成本比较高,但是效果应该会不错。”
产品思维同样体现在内容制作。事实上,在BAT中“娱乐属性”相对最重的腾讯,也将娱乐精神用在了校招上。8月23日,腾讯2017校园招聘在线宣讲会“鹅厂wo谈会”开播。这个从2014年起就推出的节目完成了新的迭代,每期邀请腾讯代表嘉宾分享学生们感兴趣的择业成长话题,主要聚焦大学生在求职过程中关注的职业成长,公司文化福利,如何准备面试,人生选择等话题。
可以肯定,腾讯用于招聘的产品思维,同样能在很大程度上让其雇主品牌更为清晰。
做最好的自己
总之,无论BAT,还是其他科技企业,一切招聘方式指向一点:对于人才的渴求与重视,以及助其成长的平台精神。智联招聘发布的《2016年应届毕业生就业力调研报告》显示:工作的意涵正趋向多元,接受调查的应届毕业生中,62.6%的学生选“挣钱”,但希望通过工作“成就自己的事业”同样占到 71%。
职场新人迫切希望通过工作获得成长,而困扰不少学生的一个问题是:加入发展初期的中小企业以谋得更快成长速度?还是加入镁光灯下的巨头,换得更大的价值感?事实上,这个问题绝非二元对立。就像《移动风暴》一书中对谷歌的描述:“谷歌就像是个大学校园,这也正是它希望传递的感觉,谷歌的成功源于从顶级院校招聘来的工程师的素质。谷歌希望让他们感觉自己从未离开过学校,以便始终保持好奇心,永远创新,而不是像其他公司那样,觉得自己加入了刻板的海军陆战队。”
事实上,硅谷的真正秘密正是在于它的以人为本,正如里德·霍夫曼在《联盟》中所言:我们早已告别终身雇佣制时代,新型忠诚观需要管理者和员工相互信任,相互投资,共同受益——这也意味着,企业与员工正在从所谓“雇佣”逐渐走向“彼此共振”的联盟关系。在这种关系里,员工,尤其初出校园的年轻人,他们的真正使命其实真的只有一条:做最好的自己。
李北辰/文(知名科技自媒体,致力于为您提供文字优雅的原创科技文章;微信公号:李北辰)
② 机器学习书籍选择
机器学习
机器学习 by 周志华: 周志华老师的这本书非常适合作为机器学习入门的书籍,书中的例子十分形象且简单易懂。
统计机器学习 by 李航:李航老师的这本书偏优化和推倒,推倒相应算法的时候可以参考这本书。
PRML by Christopher Bishop: PRML这本书有点偏Bayesian了,初学者看起来可能有些困难,可以和前两本结合起来看。
GPCA by Yi Ma: 这本书由马毅老师耗时十年精心打造,推荐阅读。
Machine Learning A Probabilistic Perspective Learning by Kevin P. Murphy: MLAPP这本书也是一本比较经典的机器学习书,可以和PRML互相补充着来看。
自然语言处理
数学之美 by 吴军:吴军老师的这本书适合作为入门自然语言处理的科普读物。
统计自然语言处理 by 宗成庆:中文版的自然语言处理图书是比较少的,这本书由中科院宗成庆老师所写,推荐初学者先阅读此书。
Foundations of Statistical Natural Language Processing by Christopher D. Manning: 本书由Manning大神所写,在1999年出版,最近比较火的Deep Learning for NLP没有涉及,不过可以参考他的学生Socher开的这门课 CS 224N / Ling 284。
Speech and Language Processing by Dan Jurafsky: 这本书第三版已经更新一部分章节了,书中介绍了deep learning for nlp方面的技术,推荐阅读。
③ 如何用FPGA加速卷积神经网络
深度学习本身是一个非常庞大的知识体系。本文更多想从程序员的视角出发,让大家观察一下深度学习对程序员意味着什么,以及我们如何利用这样一个高速发展的学科,来帮助程序员提升软件开发的能力。
本文根据费良宏在2016QCon全球软件开发大会(上海)上的演讲整理而成。
前言
1973年,美国上映了一部热门的科幻电影《WestWorld》,三年之后又有一个续集叫做《FutureWorld》。这部电影在80年代初被引进到中国叫《未来世界》。那部电影对我来讲简直可以说得上是震撼。影片中出现了很多机器人,表情丰富的面部下面都是集成电路板。这让那时候的我觉得未来世界都是那么遥远、那么神秘。
时间到了2016年,很多朋友可能都在追看HBO斥巨资拍摄的同一题材的系列剧《WestWorld》。如果前两部电影还是局限在机器人、人工智能这样的话题,2016年的新剧则在剧情和人工智能的思考方面有了很大的突破。不再渲染机器人是否会威胁到人类,而是在探讨“Dreamsaremainlymemories”这一类更具哲理的问题。
“记忆究竟如何影响了智能”这个话题非常值得我们去思考,也给我们一个很好的启示——今天,人工智能领域究竟有了怎样的发展和进步。
今天我们探讨的话题不仅仅是简单的人工智能。如果大家对深度学习感兴趣,我相信各位一定会在搜索引擎上搜索过类似相关的关键字。我在Google上以deeplearning作为关键字得到了2,630万个搜索的结果。这个数字比一周之前足足多出了300多万的结果。这个数字足以看得出来深度学习相关的内容发展的速度,人们对深度学习的关注也越来越高。
从另外的一个角度,我想让大家看看深度学习在市场上究竟有多么热门。从2011年到现在一共有140多家专注人工智能、深度学习相关的创业公司被收购。仅仅在2016年这种并购就发生了40多起。
其中最疯狂的是就是Google,已经收购了 11 家人工智能创业公司,其中最有名的就是击败了李世石九段的 DeepMind。排名之后的就要数 Apple、Intel以及Twitter。以Intel 公司为例,仅在今年就已经收购了 3 家创业公司,Itseez、Nervana 和 Movidius。这一系列大手笔的并购为了布局人工智能以及深度学习的领域。
当我们去搜索深度学习话题的时候,经常会看到这样的一些晦涩难懂的术语:Gradient descent(梯度下降算法)、Backpropagation(反向传播算法)、Convolutional Neural Network(卷积神经网络)、受限玻耳兹曼机(Restricted Boltzmann Machine)等。
如打开任何一篇技术文章,你看到的通篇都是各种数学公式。大家看到如下左边的图,其实并不是一篇高水准的学术论文,而仅仅是维基网络关于玻耳兹曼机的介绍。维基网络是科普层面的内容,内容复杂程度就超过了大多数数学知识的能力。
在这样的背景之下,我今天的的话题可以归纳成三点:第一,我们为什么要学习深度学习;第二,深度学习最核心的关键概念就是神经网络,那么究竟什么是神经网络;第三,作为程序员,当我们想要成为深度学习开发者的时候,我们需要具备怎样的工具箱,以及从哪里着手进行开发。
为什么要学习深度学习
首先,我们谈谈为什么要学习深度学习。在这个市场当中,最不缺乏的就是各种概念以及各种时髦新技术的词汇。深度学习有什么不一样的地方?我非常喜欢AndrewNg(吴恩达)曾经用过的一个比喻。
他把深度学习比喻成一个火箭。这个火箭有一个最重要的部分,就是它的引擎,目前来看在这个领域里面,引擎的核心就是神经网络。大家都知道,火箭除了引擎之外还需要有燃料,那么大数据其实就构成了整个火箭另外的重要组成部分——燃料。以往我们谈到大数据的时候,更多是强调存储和管理数据的能力,但是这些方法和工具更多是对于以往历史数据的统计、汇总。
而对于今后未知的东西,这些传统的方法并不能够帮助我们可以从大数据中得出预测的结论。如果考虑到神经网络和大数据结合,我们才可能看清楚大数据真正的价值和意义。AndrewNg就曾经说过“我们相信(神经网络代表的深度学习)是让我们获得最接近于人工智能的捷径”。这就是我们要学习深度学习的一个最重要的原因。
其次,随着我们进行数据处理以及运算能力的不断提升,深度学习所代表的人工智能技术和传统意义上人工智能技术比较起来,在性能上有了突飞猛进的发展。这主要得益于在过去几十间计算机和相关产业不断发展带来的成果。在人工智能的领域,性能是我们选择深度学习另一个重要的原因。
这是一段Nvidia在今年公布的关于深度学习在无人驾驶领域应用的视频。我们可以看到,将深度学习应用在自动驾驶方面,仅仅经历了3千英里的训练,就可以达到什么样的程度。在今年年初进行的实验上,这个系统还不具备真正智能能力,经常会出现各种各样的让人提心吊胆的状况,甚至在某些情况下还需要人工干预。
但经过了3千英里的训练之后,我们看到在山路、公路、泥地等各种复杂的路况下面,无人驾驶已经有了一个非常惊人的表现。请大家注意,这个深度学习的模型只经过了短短几个月、3千英里的训练。
如果我们不断完善这种模型的话,这种处理能力将会变得何等的强大。这个场景里面最重要的技术无疑就是深度学习。我们可以得出一个结论:深度学习可以为我们提供强大的能力,如果程序员拥有了这个技术的话,无异于会让每个程序员如虎添翼。
神经网络快速入门
如果我们对于学习深度学习没有任何疑虑的话,接下来就一定会关心我需要掌握什么样的知识才能让我进入到这个领域。这里面最重要的关键技术就是“神经网络”。说起“神经网络”,容易混淆是这样两个完全不同的概念。
一个是生物学神经网络,第二个才是我们今天要谈起的人工智能神经网络。可能在座的各位有朋友在从事人工智能方面的工作。当你向他请教神经网络的时候,他会抛出许多陌生的概念和术语让你听起来云里雾里,而你只能望而却步了。
对于人工智能神经网络这个概念,大多数的程序员都会觉得距离自己有很大的距离。因为很难有人愿意花时间跟你分享神经网络的本质究竟是什么。而你从书本上读的到的理论和概念,也很让你找到一个清晰、简单的结论。
今天就我们来看一看,从程序员角度出发神经网络究竟是什么。我第一次知道神经网络这个概念是通过一部电影——1991年上映的《终结者2》。男主角施瓦辛格有一句台词:
“MyCPUisaneural-netprocessor;alearningcomputer.”(我的处理器是一个神经处理单元,它是一台可以学习的计算机)。从历史来看人类对自身智力的探索,远远早于对于神经网络的研究。
1852年,意大利学者因为一个偶然的失误,将人类的头颅掉到硝酸盐溶液中,从而获得第一次通过肉眼关注神经网络的机会。这个意外加速了对人类智力奥秘的探索,开启了人工智能、神经元这样概念的发展。
生物神经网络这个概念的发展,和今天我们谈的神经网络有什么关系吗?我们今天谈到的神经网络,除了在部分名词上借鉴了生物学神经网络之外,跟生物学神经网络已经没有任何关系,它已经完全是数学和计算机领域的概念,这也是人工智能发展成熟的标志。这点大家要区分开,不要把生物神经网络跟我们今天谈到的人工智能有任何的混淆。
90年代中期,由Vapnik等人提出了支持向量机算法(Support Vector Machines,支持向量机)。很快这个算法就在很多方面体现出了对比神经网络的巨大优势,例如:无需调参、高效率、全局最优解等。基于这些理由,SVM算法迅速打败了神经网络算法成为那个时期的主流。而神经网络的研究则再次陷入了冰河期。
在被人摒弃的十年里面,有几个学者仍然在坚持研究。其中很重要的一个人就是加拿大多伦多大学的Geoffery Hinton教授。2006年,他的在著名的《Science》杂志上发表了论文,首次提出了“深度信念网络”的概念。
与传统的训练方式不同,“深度信念网络”有一个“预训练”(pre-training)的过程,这可以方便的让神经网络中的权值找到一个接近最优解的值,之后再使用“微调”(fine-tuning)技术来对整个网络进行优化训练。这两个技术的运用大幅度减少了训练多层神经网络的时间。在他的论文里面,他给多层神经网络相关的学习方法赋予了一个新名词— “深度学习”。
很快,深度学习在语音识别领域崭露头角。接着在2012年,深度学习技术又在图像识别领域大展拳脚。Hinton与他的学生在ImageNet竞赛中,用多层的卷积神经网络成功地对包含一千个类别的一百万张图片进行了训练,取得了分类错误率15%的好成绩,这个成绩比第二名高了将近11个百分点。
这个结果充分证明了多层神经网络识别效果的优越性。从那时起,深度学习就开启了新的一段黄金时期。我们看到今天深度学习和神经网络的火热发展,就是从那个时候开始引爆的。
利用神经网络构建分类器,这个神经网络的结构是怎样的?
其实这个结构非常简单,我们看到这个图就是简单神经网络的示意图。神经网络本质上就是一种“有向图”。图上的每个节点借用了生物学的术语就有了一个新的名词 – “神经元”。连接神经元的具有指向性的连线(有向弧)则被看作是“神经”。这这个图上神经元并不是最重要的,最重要的是连接神经元的神经。每个神经部分有指向性,每一个神经元会指向下一层的节点。
节点是分层的,每个节点指向上一层节点。同层节点没有连接,并且不能越过上一层节点。每个弧上有一个值,我们通常称之为”权重“。通过权重就可以有一个公式计算出它们所指的节点的值。这个权重值是多少?我们是通过训练得出结果。它们的初始赋值往往通过随机数开始,然后训练得到的最逼近真实值的结果作为模型,并可以被反复使用。这个结果就是我们说的训练过的分类器。
节点分成输入节点和输出节点,中间称为隐层。简单来说,我们有数据输入项,中间不同的多个层次的神经网络层次,就是我们说的隐层。之所以在这样称呼,因为对我们来讲这些层次是不可见的。输出结果也被称作输出节点,输出节点是有限的数量,输入节点也是有限数量,隐层是我们可以设计的模型部分,这就是最简单的神经网络概念。
如果简单做一个简单的类比,我想用四层神经网络做一个解释。左边是输入节点,我们看到有若干输入项,这可能代表不同苹果的RGB值、味道或者其它输入进来的数据项。中间隐层就是我们设计出来的神经网络,这个网络现在有不同的层次,层次之间权重是我们不断训练获得一个结果。
最后输出的结果,保存在输出节点里面,每一次像一个流向一样,神经是有一个指向的,通过不同层进行不同的计算。在隐层当中,每一个节点输入的结果计算之后作为下一层的输入项,最终结果会保存在输出节点上,输出值最接近我们的分类,得到某一个值,就被分成某一类。这就是使用神经网络的简单概述。
除了从左到右的形式表达的结构图,还有一种常见的表达形式是从下到上来表示一个神经网络。这时候,输入层在图的最下方,输出层则在图的最上方。从左到右的表达形式以AndrewNg和LeCun的文献使用较多。而在Caffe框架里则使用的则是从下到上的表达。
简单来说,神经网络并不神秘,它就是有像图,利用图的处理能力帮助我们对特征的提取和学习的过程。2006年Hinton的那篇著名的论文中,将深度学习总结成三个最重要的要素:计算、数据、模型。有了这三点,就可以实现一个深度学习的系统。
程序员需要的工具箱
对于程序员来说,掌握理论知识是为了更好的编程实践。那就让我们看看,对于程序员来说,着手深度学习的实践需要准备什么样的工具。
硬件
从硬件来讲,我们可能需要的计算能力,首先想到的就是CPU。除了通常的CPU架构以外,还出现了附加有乘法器的CPU,用以提升计算能力。此外在不同领域会有DSP的应用场景,比如手写体识别、语音识别、等使用的专用的信号处理器。还有一类就是GPU,这是一个目前深度学习应用比较热门的领域。最后一类就是FPGA(可编程逻辑门阵列)。
这四种方法各有其优缺点,每种产品会有很大的差异。相比较而言CPU虽然运算能力弱一些,但是擅长管理和调度,比如读取数据,管理文件,人机交互等,工具也丰富。DSP相比而言管理能力较弱,但是强化了特定的运算能力。
这两者都是靠高主频来解决运算量的问题,适合有大量递归操作以及不便拆分的算法。GPU的管理能力更弱一些,但是运算能力更强。但由于计算单元数量多,更适合整块数据进行流处理的算法。
FPGA在管理与运算处理方面都很强,但是开发周期长,复杂算法开发难度较大。就实时性来说,FPGA是最高的。单从目前的发展来看,对于普通程序员来说,现实中普遍采用的计算资源就还是是CPU以及GPU的模式,其中GPU是最热门的领域。
这是我前天为这次分享而准备的一个AWS 上p2的实例。仅仅通过几条命令就完成了实例的更新、驱动的安装和环境的设置,总共的资源创建、设置时间大概在10分钟以内。而之前,我安装调试前面提到的那台计算机,足足花了我两天时间。
另外,从成本上还可以做一个对比。p2.8xLarge 实例每小时的费用是7.2美元。而我自己那台计算机总共的花费了是¥16,904元。这个成本足够让我使用350多个小时的p2.8xLarge。在一年里使用AWS深度学习站就可以抵消掉我所有的付出。随着技术的不断的升级换代,我可以不断的升级我的实例,从而可以用有限的成本获得更大、更多的处理资源。这其实也是云计算的价值所在。
云计算和深度学习究竟有什么关系?今年的8月8号,在IDG网站上发表了一篇文章谈到了这个话题。文章中做了这样一个预言:如果深度学习的并行能力不断提高,云计算所提供的处理能力也不断发展,两者结合可能会产生新一代的深度学习,将带来更大影响和冲击。这是需要大家考虑和重视的一个方向!
软件
深度学习除了硬件的基础环境之外。程序员会更关心与开发相关的软件资源。这里我罗列了一些曾经使用过的软件框架和工具。
Scikit-learn是最为流行的一个python机器学习库。它具有如下吸引人的特点:简单、高效且异常丰富的数据挖掘/数据分析算法实现; 基于NumPy、SciPy以及matplotlib,从数据探索性分析,数据可视化到算法实现,整个过程一体化实现;开源,有非常丰富的学习文档。
Caffe专注在卷及神经网络以及图像处理。不过Caffe已经很久没有更新过了。这个框架的一个主要的开发者贾扬清也在今年跳槽去了Google。也许曾经的霸主地位要让位给他人了。
Theano 是一个非常灵活的Python 机器学习的库。在研究领域非常流行,使用上非常方便易于定义复杂的模型。Tensorflow 的API 非常类似于Theano。我在今年北京的QCon 大会上也分享过关于Theano 的话题。
Jupyter notebook 是一个很强大的基于ipython的python代码编辑器,部署在网页上,可以非常方便的进行交互式的处理,很适合进行算法研究合数据处理。
Torch 是一个非常出色的机器学习的库。它是由一个比较小众的lua语言实现的。但是因为LuaJIT 的使用,程序的效率非常出色。Facebook在人工智能领域主打Torch,甚至现在推出了自己的升级版框架Torchnet。
深度学习的框架非常之多,是不是有一种乱花渐欲迷人眼的感觉?我今天向各位程序员重点介绍的是将是TensorFlow。这是2015年谷歌推出的开源的面向机器学习的开发框架,这也是Google第二代的深度学习的框架。很多公司都使用了TensorFlow开发了很多有意思的应用,效果很好。
用TensorFlow可以做什么?答案是它可以应用于回归模型、神经网络以深度学习这几个领域。在深度学习方面它集成了分布式表示、卷积神经网络(CNN)、递归神经网络(RNN) 以及长短期记忆人工神经网络(Long-Short Term Memory, LSTM)。
关于Tensorflow 首先要理解的概念就是Tensor。在辞典中对于这个词的定义是张量,是一个可用来表示在一些向量、标量和其他张量之间的线性关系的多线性函数。实际上这个表述很难理解,用我自己的语言解释Tensor 就是“N维数组”而已。
使用 TensorFlow, 作为程序员必须明白 TensorFlow这样几个基础概念:它使用图 (Graph) 来表示计算任务;在被称之为 会话 (Session) 的上下文 (context) 中执行图;使用 Tensor 表示数据;通过 变量 (Variable) 维护状态;使用 feed 和 fetch 可以为任意的操作(arbitrary operation) 赋值或者从其中获取数据。
一句话总结就是,TensorFlow 就是有状态图的数据流图计算环境,每个节点就是在做数据操作,然后提供依赖性和指向性,提供完整数据流。
TensorFlow安装非常简单,但官网提供下载的安装包所支持的CUDA 的版本是7.5。考虑到CUDA 8 的让人心动的新特以及不久就要正式发布的现状。或许你想会考虑立即体验CUDA 8,那么就只能通过编译Tensorflow源代码而获得。目前TensorFlow已经支持了Python2.7、3.3+。
此外,对于使用Python 语言的程序员还需要安装所需要的一些库,例如:numpy、protobuf等等。对于卷积处理而言,cuDNN是公认的性能最好的开发库,请一定要安装上。常规的Tensorsorflow的安装很简单,一条命令足矣:
$ pip3 install —upgrade
如果想评估一下或者简单学习一下,还可以通过Docker进行安装,安装的命令如下:
$ docker run -it -p 8888:8888 gcr.io/tensorflow/tensorflow
TensorFlow有很多优点。首先,目前为止,深度学习的开发框架里面TensorFlow的文档做的最好,对程序员学习而言是非常好的一点。第二,TensorFlow有丰富的参考实例,作为参考学习起来非常容易。
第三,开发者社区活跃,在任何一个深度学习的社区里,都有大量关于TensorFlow的讨论。第四,谷歌的支持力度非常大,从2015年到现在升级速度非常快,这是其他开源框架远远达不到的结果。
参考TensorFlow的白皮书,我们会看到未来TensorFlow还将会有巨大的发展潜力。让我特别感兴趣是这两个方向。第一,支持跨多台机器的 parallelisation。尽管在0.8版本中推出了并行化的能力,但是目前还不完善。随着未来不断发展,依托云计算的处理能力的提升这个特性将是非常让人振奋的。
第二,支持更多的开发语言,对于开发者来说这是一个绝大的利好,通过使用自己擅长的语言使用TensorFlow应用。这些开发语言将会扩展到Java、Lua以及R 等。
在这里我想给大家展示一个应用Tensorflow 的例子。这个例子的代码托管在这个网址上 。白俄罗斯的现代印象派艺术家Leonid Afremov善于用浓墨重彩来表现都市和风景题材,尤其是其雨景系列作品。他习惯用大色块的铺陈来营造光影效果,对反光物体和环境色的把握非常精准。
于是我就找到了一张上海东方明珠电视塔的一张摄影作品,我希望通过Tensorflow 去学习一下Leonid Afremov 的绘画风格,并将这张东方明珠的照片处理成那种光影色彩丰富的作品风格。利用Tensorflow 以及上面提到的那个项目的代码,在一个AWS 的p2类型的实例上进行了一个一千次的迭代,于是就得到了下图这样的处理结果。
这个处理的代码只有350行里,模型使用了一个成名于2014年ImageNet比赛中的明星 VGG。这个模型非常好,特点就是“go depper”。
TensorFlow 做出这样的作品,并不仅仅作为娱乐供大家一笑,还可以做更多有意思的事情。将刚才的处理能力推广到视频当中,就可以看到下图这样的效果,用梵高著名的作品”星月夜“的风格就加工成了这样新的视频风格。
可以想象一下,如果这种处理能力在更多领域得以应用,它会产生什么样的神奇结果?前景是美好的,让我们有无限遐想。事实上我们目前所从事的很多领域的应用开发都可以通过使用神经网络和深度学习来加以改变。对于深度学习而言,掌握它并不是难事。每一个程序员都可以很容易的掌握这种技术,利用所具备的资源,让我们很快成为深度学习的程序开发人员。
结束语
未来究竟是什么样,我们没有办法预言。有位作家Ray Kurzweil在2005年写了《奇点临近》一书。在这本书里面他明确告诉我们,那个时代很快到来。作为那个时代曙光前的人群,我们是不是有能力加速这个过程,利用我们学习的能力实现这个梦想呢?
中国人工智能的发展
人工智能的时代无疑已经到来,这个时代需要的当然就是掌握了人工智能并将其解决具体问题的工程师。坦率的说,市场上这一类的工程师还属于凤毛麟角。职场上的薪酬待遇可以看得出来这样的工程师的抢手的程度。人工智能这门学科发展到今天,就学术自身而言已经具备了大规模产业化的能力。
所以说,对于工程师而言当务之急就是尽快的掌握应用人工智能的应用技术。当下在互联网上关于人工智能的学习资料可以说已经是“汗牛充栋”,那些具备了快速学习能力的工程师一定会在人工智能的大潮当中脱颖而出。
中国发展人工智能产业的环境已经具备。无论从创业环境、人员的素质乃至市场的机遇而言完全具备了产生产业变革的一切条件。与美国相比较,在人工智能的许多领域中国团队的表现也可以说是不逞多让。就人工智能的技术层面而言,中国的工程师与全球最好的技术团队正处于同一个起跑线上。
时不我待,中国的工程师是有机会在这个领域大展身手的。不过值得注意的是,要切忌两点:一是好高骛远,盲目与国外攀比。毕竟积累有长短,术业有专攻,我们要立足于已有的积累,寻求逐步的突破。二是一拥而上,盲目追求市场的风口。人工智能的工程化需要大量的基础性的积累,并非一蹴而就简单复制就可以成功。
中国的科研技术人员在人工智能领域的成就有目共睹。在王咏刚的一篇文章里面,他统计了从2013年到2015年SCI收录的“深度学习”论文,中国在2014年和2015年超已经超过了美国居于领跑者的位置。
另外一让我感到惊讶的事情,Google的JeffDean在2016年发表过一篇名为《TensorFlow:Asystemforlarge-scalemachinelearning》的论文。文章的22个作者里面,明显是中国名字的作者占已经到了1/5。如果要列举中国人/华人在人工智能领域里的大牛,吴恩达、孙剑、杨强、黄广斌、马毅、张大鹏……很容易就可以说出一大串。
对于中国来说目前的当务之急是人工智能技术的产业化,唯有如此我们才可以讲科研/智力领域的优势转化为整体的、全面的优势。在这一点上,中国是全球最大的消费市场以及制造业强国,我们完全有机会借助市场的优势成为这个领域的领先者。
硅谷创新企业
硅谷虽然去过许多回,但一直无缘在那里长期工作。在人工智能领域的市场我们听到的更多是围绕Google、Apple、Intel、Amazon这样的一些大型科技公司的一举一动。但是在美国市场上还有一大批小型的创业企业在人工智能这个领域有惊艳的表现。仅以硅谷区域的公司为例:
Captricity,提供了手写数据的信息提取;
VIVLab,针对语音识别开发了虚拟助手服务;
TERADEEP,利用FPGA提供了高效的卷积神经网络的方案;
还有提供无人驾驶解决方案的NetraDyne。
这个名单还可以很长,还有许许多多正在利用人工智能技术试图去创造历史的团队正在打造他们的梦想。这些团队以及他们正在专注的领域是值得我们去学习和体会的。
④ 华人在人工智能领域很牛,那到底有多牛
人工智能这把火已经烧到了国家战略层面,连美国总统和政府机构也卷了进来。上周四,奥巴马主持白宫前沿峰会,展望美国在未来50年的发展。峰会中,白宫发布报告《国家人工智能研究与发展策略规划》。
《IEEE模式分析与机器智能汇刊》的华人前10位大牛,与非华人前10位大牛,在每个人的总引用数上几乎不相上下。的确,最顶尖的人工智能科学家里,中国人/华人的贡献丝毫不亚于其他科学家。
另外,如果对人工智能特别是模式识别的研究领域不熟悉,那么,记住表中这20位顶尖科学家的名字吧。有兴趣的话,大家可以去搜一搜他们的简历,看看他们都在哪里工作,在哪里做研究,他们的学生、同事都是谁,相信会有很多发现。
⑤ 雷军为什么辞猎豹董事长
雷军辞任猎豹移动董事长:傅盛上位,金山腾讯系淡出猎豹管理。
不过,业内还有一种说法认为,雷军此番辞任还有一重目的,就是希望在小米公司上市前,尽量避免过多关联交易的质疑。
猎豹2017年报曾披露,公司已与小米公司签署了各种协议,相互提供营销和软件安装服务。截至2014年,2015年及2016年,猎豹从小米得到的收入分别为人民币410万元、117000元及28000元,同时这三年分别向小米支付了人民币290万元,4780万元及5940万元。
目前,雷军还担任着金山网络董事局大大一职。
⑥ 深度学习对于非it人员有必要学习吗
如果喜欢为什么不可以呢,只是线下学习费用高昂、地域限制,建议选择线上平回台。如今答线上学习无论是就业还是教学均已完善。扣丁学堂具有完整系统的计算机方面开发培训视频教程,顶级行内大牛为学员们设定了可视化的学习线路直通车,让没有学习方向的学子一目了然。
⑦ 人工智能与人类文明峰会在京召开了吗
12月1日,“全球思想来盛筵—人工智能源与人类文明”AI峰会在京召开。“全球思想盛筵”是今日头条举办的一场探讨人工智能与人类文明全球顶级峰会。全球人工智能领域的领军者相聚北京,探讨人工智能的未来。
科大讯飞、出门问问、Face+等一批在语义分析别、图像识别、人机交互等领域取得不斐成绩的国内AI企业的领袖们在峰会中探讨人工智能技术的落地与应用。作为东道主的今日头条,创始人张一鸣、人工智能实验室主任马维英也在会上分享今日头条对人工智能未来发展的理解与思考。