第五章 机遇来临:AI先行的创新与创业(第7/18页)

我在参加瑞士达沃斯经济论坛时,曾和维基百科创始人吉米·威尔士等人讨论平台的力量。我们觉得,在国际化、资本、互联网趋势等共同作用下,未来的AI将会形成非常强大的平台,美国如谷歌、Facebook,中国如微信、淘宝。这些平台将汇集、整合原本零散的内容或应用,并因此大幅改善用户体验,使更多用户更容易享受到AI的巨大价值。

但专业人士和普通公众也有理由对这些集中了大量数据和计算资源的AI平台提出合理的质疑。例如,这些平台特别是巨头联盟的力量将特别强大,它们对整个科技圈的舆论影响将是决定性的。体量较小的平台发出的不同声音,很难在巨头世界里传达给普通公众。

同时,巨头围绕AI建立的平台也缺乏足够的透明性,较难与外界保持有效的沟通。一旦这些AI平台的利益与公众利益不符,在商业上也找不到可以制衡这些大平台的第三方力量。举个例子,假如Facebook借助庞大的社交网络资源,希望通过智能算法主动引导信息流动,并进而影响美国总统大选时的选民倾向,这在技术上几乎是完全可行的。我们当然知道,目前的谷歌、Facebook等巨头对人类的实际贡献远多于它们“作恶”的可能性,但从法律、道德角度,我们又必须想办法防范这一潜在风险。因为再友善的巨头本质上也是商业公司,巨大的商业利益永远是诱惑它们“作恶”的诱饵。

技术开源和数据开放方面,其实谷歌已经算是做得非常好的了。谷歌开源的Tensor Flow框架,已经成为业界深度学习的标准框架之一。谷歌在过去的几年时间里,连续开源You Tube 8M、Open Images、Audio Set等包含数百万份视频、图片、音频的标注数据集,为人工智能领域的科研发展提供“原材料”。但我们也必须知道,谷歌、Facebook这样的大企业很难主动开放那些关乎它们核心业务的网页标注、结果排序的特征、用户点击次数、广告转换指标等,对这些数据的垄断将AI世界里的大数据海洋分割成了一个个相互隔离的区域。

更糟糕的是,巨头建立的AI平台以及巨头之间的结盟关系,有可能让数字鸿沟变得越来越严重。信息在人工智能算法的组织、管理下,会更多地向有信息理解和处理能力的平台、企业、终端用户倾斜,接受过高等教育、积极参与网络生活的用户更加容易获得信息和人工智能应用的帮助,而教育水平低、较少参与网络生活的用户则难以找到可以改善自己生活的有效信息。想一想电子商务平台上的智能推荐算法:一个用户越是频繁购物,就越容易得到最适合自己的商品信息。类似的场景会在许多有真实信息需求的领域存在,信息或大数据世界里的富者愈富、穷者愈穷现象并不是危言耸听。

对于这样的“巨头风险”,我觉得我们应该从法律和制度建设层面,多做些有前瞻性的事情,包括:

·提高大数据和人工智能应用领域的透明度,鼓励公开那些不涉及用户隐私和商业机密的研发成果,鼓励开源。

·更多地鼓励利用区块链技术管理数据和信息流动,从技术和制度双方面打破科技巨头对大数据的垄断。

·成立有社会责任感的VC基金,专注于新兴的大数据和人工智能方向。

·多关注能够帮助落后人群获取信息、享受AI福利的平台。

·鼓励大众和媒体去监督行业巨头的商业行为。

在瑞士达沃斯,我受邀与麻省理工学院媒体实验室负责人伊藤穰一探讨巨头可能对AI的垄断。我的看法是,目前的体系会持续促使大型科技企业不断发展。它们有能力垄断资源、垄断数据,在商业利益和激烈竞争的驱使下,它们会不断地竞逐更为精进的技术能力,为公司赚取更大的利益。对于较小企业,进入AI市场的难度的确比移动互联网时代的创业高出非常多。我呼吁大力推动AI生态系的开放性。在创新工场北京总部和我们所投的创业公司体系中,已经启动了全新的AI技术相关研发工作。近期,创新工场也成立了人工智能工程院,带着孵化中国AI生态系的目标投入大量资源,招聘培训一批年轻工程师入门AI领域,展开可公开数据集的采集和标注。我们也积极寻求在中国和全球资本市场的融资和成长机会。