非科幻思考(第7/20页)
所谓监督学习,就是每一个数据由程序员做一个标注:“这个数据是好的。”“这个数据是猫。”“这个数据是男人因为嫉妒而殴打老婆。”不管数据本身是数字、棋谱、语言、图像还是视频,都需要程序员先给数据做标注,才能让人工智能学会这些标注。但是对于人类的情感与行为的超级数据库一一识别和标注,实在是太过于烦琐困难的工作。而非监督学习就是完全没有人进行标注,只把原始数据丢给人工智能,看看它能学到什么规律。我相信非监督数据在很多工程领域可以自动进行,因为步骤和成败的结果是自然可观测的。但是在人类情感与行为领域,如果不以人的解释做标注,如果没有人来诠释情境中发生了什么故事,机器能够学习和领会吗?我觉得很难。
另一种可能性,就是每个人和自己的人工智能助理之间的数据学习。由一个人不断告知人工智能所有情感和行为的前因后果:他碰到我,所以我不高兴;他没有记得给我买东西,所以我不高兴;餐厅的灯光太昏暗,所以我不高兴。若所有人都将前因后果事无巨细地解释给人工智能听,就像父母将这个世界的机理解释给孩子,那么它肯定可以全都记住。如果足够详细,那它至少能学会这一个人的情感行为特征和心理因果特征。这相当于是每个人自己给行为数据做标记。这种路径在未来有可能成功,但取决于每个人是否愿意详细教它。
人工智能识别人类情感和意图,还有可能有更本质的困难,那就是人工智能无法以自己映照他人。
人类识别他人的情感和意图,并不是因为大数据学习。实际上人一生能遇见的人、交谈和交往的经历都是很有限的。人能够从少数经历中学到有关他人的很多情感和行为知识,能直觉感知他人的心境,不是因为人类头脑处理能力更快,而是因为人类能够以自己映照他人,将心比心。
最直接的映照,是镜面反射。人脑中有一些细胞,能够直接反射他人的行为意图,叫作镜像神经元。这种神经元不仅人类拥有,在较高级的灵长类动物头脑中也有。当一个人看见另一个人拿起锤子,自己即使手里没有锤子,与“动手砸”相关的神经元也会“亮”起来。
这种“读懂他人”属于生理性质的,大脑对他人的意图直接有反映,反映出来的意图,可以被观看者直接感受到,因此叫“镜像神经元”。人工智能可能生成这种直接的反映吗?缺乏生理共同点,应该不太可能。
另一方面,人们可以用自我观察映照出他人的情感和意图。面对一个情境的分析,人们可以把自己代入同样的情境,假想自己会有什么样的感情。能够让人悲欢离合的影视文学,就是因为人有代入感,才会让人喜爱。这一方面来源于人类的情感相似性,都有人之常情,另一方面人可以通过读取自己的心思过程,以己度人。
也就是说,人类对他人的理解,除了可以“外部观察”和“语言交流”,还能有“内部观察”。事实上,“内部观察”是如此强大,我们对于很多从来没见过的事情,只要代入自己想想,就能对其中的前因后果猜出个大概。现在的问题是,如果机器完全没有类人的情感,仅靠“外部观察”和“语言交流”,能达到同样的理解他人的效果吗?我不知道。
以上讨论全都是建立在人工智能没有类人情感的前提下,只考虑技术上如何学习理解人类情感。那么人工智能是否有可能产生类人情感呢?这是另一个问题了,本文结尾的时候会有一些讨论。
仅靠“外部观察”能否理解他人的情感和意图,还涉及另一个更客观的问题:大数据统计能否预知个体行为。
统计学永远只告诉我们系统信息,即便每个人都是完全不一样的随机数,在大数定理的保证下,也能呈现一些稳定的集体特征。然而这种稳定的集体特征并不能预测每一个个体,对“人类行为”的学习不等于对“个人行为”的学习。举个例子,如果一个人被人骂会怎样,这几乎是一个没法靠大数据统计学习得出答案的问题。有的人会忍,有的人会打人,有的人会报告执法机构,有的人会暗中寻求报复,有的人会嬉笑,有的人会哭,每类几乎都有很多。在大数据统计研究中,相关性会非常弱,最终你仍然不知道某个具体个人会如何做出回应。每个人的不同反应取决于个性、场景、社会地位、个人经历、文化群体、习惯等,而如果控制了所有这些变量,每个群体内的个体又会变得极少。外在条件相似的两个人面临同样的情境可能反应天差地别。所有这些个体差异,都给通过大数据统计预测个体行为带来很大的不确定性。人对他人最可靠的预测仍然来自对他人内心世界的理解。