第一章 人工智能来了(第5/14页)
新一代搜索引擎
搜索引擎里也有人工智能?
在很多人眼中,搜索引擎是诞生于20世纪的一项互联网核心技术。谷歌创始人拉里·佩奇(Larry Page)和谢尔盖·布林(Sergey Brin)于1996年提出的Page Rank算法大幅提升了搜索引擎结果排序的准确性,但二十余年过去了,搜索引擎的技术、算法难道不是已经非常成熟了吗?这里还有人工智能发挥作用的空间吗?
2016年2月的一天,谷歌高级副总裁、46岁的阿米特·辛格尔(Amit Singhal)宣布离开谷歌搜索引擎核心团队负责人的位置,接替他领导世界上最大搜索引擎的高级副总裁,是曾主管谷歌知识图谱和机器学习两大核心研发团队的约翰·贾南德雷亚(John Giannandrea)。这起人事变动无论对谷歌内部还是对外界来说都意味深长,当时的许多媒体将此次人事更迭解读为谷歌搜索全面由传统算法向人工智能算法转变的信号7。当然,直到2017年年初公众才知晓,阿米特·辛格尔离职的更直接原因是他卷入了一桩性骚扰案8。但当时也许是被迫而为的高管更迭,却从实际结果上体现出了谷歌搜索技术方向的深刻变革。
阿米特·辛格尔是谷歌搜索引擎早期核心算法,特别是网页排序算法的最重要贡献者。简单地说,最传统的网页排序算法是找出所有影响网页结果排序的因子,然后根据每个因子对结果排序的重要程度,用一个人为定义的、十分复杂的数学公式将所有因子串联在一起,计算出每个特定网页在最终结果页面中的排名位置。
约翰·贾南德雷亚(在谷歌工作时,我们都亲切地用姓名首字母称呼他为JG)曾主管的知识图谱和机器学习两大研发团队则代表了谷歌在人工智能领域的未来。其实,谷歌很早就开始用机器学习技术帮助搜索引擎完成结果排序。这一思路和传统算法不同。在机器学习的方向里,计算网页排序的数学模型及模型中的每一个参数不完全是由人预先定义的,而是由计算机在大数据的基础上,通过复杂的迭代过程自动学习得到的。影响结果排序的每个因子(在机器学习领域,每个影响因子也被称为“特征”)到底有多重要,或者如何参与最终的排名计算,主要由人工智能算法通过自我学习来确定。从2011年起,随着深度学习技术的复兴和谷歌大脑(Google Brain)项目的成功建设,谷歌搜索引擎使用的网页排序算法越来越依赖于深度学习技术,网页结果的相关性和准确度也由此得到了大幅提高。可以毫不夸张地说,到约翰·贾南德雷亚执掌谷歌搜索团队的时候,谷歌搜索已经是一个绝大部分由人工智能技术支撑的新一代搜索引擎了。
图8 向百度提问并直接得到答案
结果排名还只是人工智能技术在搜索引擎中应用的冰山一角。打开谷歌或类似的主流搜索引擎,人工智能的魔力无处不在。今天,我们可以直接在谷歌向搜索引擎提出问题,搜索引擎会聪明地给出许多知识性问题的答案。
图9 向谷歌提问并直接得到答案
例如,在图8中,我们可以直接向百度提问“东野圭吾多大了”,百度在结果页的最显著位置直接给出“58周岁”(2016年)的正确答案。我们甚至可以向谷歌提问:“在《哈利·波特》的系列故事里,到底是谁杀了令人尊敬的校长邓布利多?”谷歌不但直接给出杀害邓布利多的凶手名字,还显示出相关的电影剧照、故事情节、维基百科链接等。
近年来,利用人工智能技术在语音识别、自然语言理解、知识图谱、个性化推荐、网页排序等领域的长足进步,谷歌、百度等主流搜索引擎正从单纯的网页搜索和网页导航工具,转变成为世界上最大的知识引擎和个人助理——毫无疑问,人工智能技术让搜索引擎变得更聪明了。