02 人工智能的历史使命:让人类知道更多,做到更多,体验更多(第5/12页)

云计算,名字在云端,却是百度大脑最底层、最实体的部分,是IaaS(Infrastructure as a Service,基础设施服务)。

百度大脑的超强计算能力就来源于这一层,是高性能计算硬件的集团军。这个集团军拥有数十万台服务器,并且采用先进的集群操作系统来统一管理,堪称人工智能超级计算机。

为了深度学习训练的需要,百度自主研发了GPU和FPGA(现场可编程门陈列)异构计算服务器,单机可扩展至64块GPU/FPGA卡,对比传统服务器密度提升16倍,一台服务器即可完成千亿数据模型训练;百度开创性地研制了基于FPGA的人工智能处理器,提供10Tops的计算性能,相对主流的20核服务器,计算效率提升60倍,在人工智能和大数据应用上,可以达到普通服务器4~8倍的性能。

但百度的优势不只是单台机器的优秀,更在于优良的系统,优秀个体的集成形成强大的总体作战能力。针对GPU集群的智能调度和资源管理系统,可以实现计算、存储和网络资源的池化管理和动态调度,计算集群整体效率和平均使用率达到80%。将异构硬件用于线上产品,用户请求时延降至1/5,计算效率提升数十倍。

这个系统涵盖了国内最大的GPU/FPGA集群(全新的芯片技术),最大的HADOOP/SPARK集群(全新的并发数据处理技术)和运营效率最高的数据中心[全新的异构计算技术、整机柜服务器技术、100G RDMA(远程直接数据存取)通信技术和运维技术],可谓马力十足,提供了开发人工智能所需的计算能力。

它同样燃料充足。基于多年服务于大规模业务,比如通过搜索和视频技术,百度积累了大量的数据:万亿级网页数据,数十亿次搜索数据,百亿级视频、图像和语音数据,百亿级定位数据等。数据就是人工智能算法的燃料,是发展人工智能的又一基础条件。

让硬件与燃料结合的是优秀的算法和模型。百度汇聚了全球顶级科学家和工程师,在理论和实践方面持续创新,搭建了全球最大的深度神经网络,支持万亿级参数、千亿级样本、千亿级特征训练,神经网络层数远远突破100层。

硬件动力、数据燃料和算法灵魂的结合,才产生出百度的PaaS(Platform as a Service,平台服务)。百度PaaS与众不同之处在于,人工智能作为一种横向的服务贯穿全平台。通过深度学习和机器学习技术,结合超强计算、海量数据和优秀算法,在语音、图像、自然语言处理等方面拥有杰出的能力,打造出独特的知识图谱、用户画像和商业逻辑,并且向用户全面开放。用户可以非常方便地使用各种算法模块、开发工具、数据引擎为自身的商业目的服务。我们形象地把不同的平台称作天算、天像和天工,分别针对智能大数据、智能多媒体和智能物联网这三个领域提供服务。

在最上层的SaaS(Software as a Service,软件服务),百度的人工智能很容易凝结成许多垂直行业解决方案,渗透到各行各业。但我们更追求与合作伙伴一起打造智能产业生态,例如教育云、金融云、交通云、物流云等。我们认为,对智能产业生态的构建能力也是判定人工智能价值的重要标准。

在硬件、数据、算法之上还有一个重要的衡量标准,那就是人工智能企业的文化,即人工智能企业的“软实力”。搜索技术是人工智能的先驱,也是最早的互联网数字化世界的门户,其开发流程和技术核心为未来的人工智能奠定了基础。首先,搜索引擎必须与很大规模的数据打交道;其次,搜索引擎必须同时有大规模的机器学习,人工来做是不可能的事,因为数据规模太大了;最后,也是最根本的一点,搜索引擎的开发流程和工程开发文化与人工智能系统的开发是非常吻合的,都以数据为主,通过抽取其中的特征、模式,然后用这个模式给用户带来价值。人们在搜索业务中结成的协作关系,形成的业务能力和工作习惯,都很适合人工智能业务发展,与海量数据一样,积淀为人工智能企业的文化。所以陆奇在微软的做法是,培养人才先从Bing开始。你做过Bing,你到其他什么部门都可以做,那些技术在搜索看来都是很简单的技术。这个文化当然并不完美,但正如神经网络一样,可以在正确的方法指引下不断发展完善。