第二章 AI复兴:深度学习+大数据=人工智能(第7/24页)
学到了这些语言学方面的基本知识,年轻的我就大胆提出:“我能不能挑战一下图灵测试呢?”其实,我当时提出的想法很简单,就是做一个聊天机器人,而且,是一个只关注自然语言处理这个领域,且在说话风格上模仿我们的老师迈克尔·莱博维奇的小程序。我当时和另一位非常有才华的华人同学胡林肯(Lincoln Hu)一起,完成了程序的设计和开发。
我们做的那个程序,名字就叫迈克尔·莱博维奇。学生可以把这个程序当作老师,与“他”聊任何与自然语言处理课程相关的话题。比如,我们可以问这个程序说:“你能告诉我,语言学是什么吗?”这个程序就会装出老师迈克尔·莱博维奇的口吻说:“语言学就是关于人类语言的科学研究,包含句法、词法、语音学等研究方向。”更有趣的是,这个程序甚至会讲许多老师迈克尔·莱博维奇当年常讲的课堂笑话。
我们的程序还很幼稚,有些时候表现得比较呆笨,根本不像一个聪明的人类对话者。但这个小程序还是让老师迈克尔·莱博维奇笑逐颜开,无论是程序本身的幽默感,还是代码中的技术含量,都超过了老师的期望。老师给了我们A+的高分。
从技术上说,今天那些流行的聊天机器人程序和我们那个时代做的小程序相比,已经有了很大的进步。它们都在模仿人类语言风格之外,引入了更大的知识平台作为后盾。例如,聊天程序基于搜索引擎索引到的互联网网页建立知识库,从海量的页面信息中搜集可能的常见问题、常见回答的组合,这已经成为一种非常成熟的技术。当我们与这些程序聊天时,实际上既是一次人机间的对话,也是一次对机器背后庞大知识库的搜索操作。
另一方面,那些以参加图灵测试比赛为目标的聊天机器人程序,往往在对话策略方面有着非常针对性的设计。比如,不少在罗布纳奖测试中排名靠前的聊天程序,都刻意使用了一种攻击性强的对话风格,它们试图更多地控制聊天时的话语权,不给评判员太多深入追问的空间,并用挑战性的问句或引导性的话语,尽量将聊天控制在自己熟悉的话题领域内。这也是罗布纳奖测试为什么在近年要将聊天的时长从5分钟扩展到25分钟的重要原因——没有足够的时间,评判员根本来不及根据自己的思路,与对方深入交流。
无论如何,图灵测试以及为了通过图灵测试而开展的技术研发,都在过去的几十年时间里,推动了人工智能特别是自然语言处理技术的飞速发展。我们憧憬着计算机程序真正使人信服地通过图灵测试的那一天,但我们更希望看到自然语言处理技术在文本理解与分类、语音识别、自动客服应答、自然语言控制界面等领域取得更多商业上的成功。
语音识别与第二次AI热潮
生不逢时的我
20世纪80年代到90年代的第二次AI热潮中,语音识别是当时最具代表性的几项突破性进展之一,而我自己恰恰在那个时代站到了人工智能特别是语音识别研究的最前沿。
让计算机听懂人们说的每一句话、每一个字词,这是人工智能这门学科诞生第一天科学家就努力追求的目标。但直到我从事博士研究的那个时代,语音识别才真正取得实质性的进展——很大程度上是因为我和同时代学者对传统符号主义方法的摒弃。
很多人说,我在人工智能的发展史上留下了自己的名字。这的确是事实。但就像人工智能前两次热潮中的许多研究者一样,我提出的语音识别算法虽然在那个时代处于领先地位,但距离人们觉得系统可用的心理阈值还有一定的距离。我博士毕业后,在苹果公司研发的语音识别系统就难以满足当时市场上人们对听写、输入、控制等功能的需要,很难真正变成畅销的产品。