最新新闻
我要投稿
联系电话:027-87592219/20/21转188
投稿邮箱:tb@e-works.net.cn
您所在的位置:首页 > 视点

人工智能的未来将迈向通用化

发布时间:2016-10-19 作者:Mike 
关键字:人工智能 
未来五到十年,人工智能会比人类更善于做一些最基础的任务。也许他是对的,但是,同样清楚的是,他讨论的是狭义人工智能:从事特别任务,比如语音识别,图像分类以及游戏。

    人工智能的兴起依赖于计算机硬件的巨大进步。列举计算机性能和存储技术自人工智能之冬起(维基百科追溯到1984年)的30多年间的巨大进步是很乏味的。但这是此篇文章无法回避的一部分,特别是如果你已经见过IBM的沃森机器支架。

    据报道AlphaGo运行于1920个CPU和280个GPU;;击败了Lee Sedol的机器可能更加庞大,并且它使用了谷歌用于构建神经网络所开发的定制硬件。即使人工智能算法在普通笔记本上运行很慢,但在像AWS、GCE和Azure的云平台上配置一些重要的算力是容易且相对便宜的。机器学习得以实现,部分也是因为这种存储大量数据的能力。1985年时的千兆字节(GB)还很罕见且重达数百磅;现在它已司空见惯,廉价而小巧。

    除了存储和处理数据的能力,我们现在还能生成数据。在上世纪80年代,大多影像都是模拟信号。现在它们全是数字的,并有很多存储于像是Flickr、Google Photos、Apple Photos、Facebook等的网络服务商那里。许多在线照片已经被贴上了一些描述性的文本,这使得它们成为了训练人工智能系统的良好数据集。

    我们的许多对话也都是线上的,通过Facebook、Twitter和许多聊天服务。我们的购物历史也是一样。所以我们(或者更准确的说是 谷歌、苹果、雅虎、 Facebook、亚马逊等)就有了训练人工智能系统所需的数据。

    我们在算法上也取得了显著的进展。神经网络并不是特别的新,但是“深度学习”却堆叠了一系列通过反馈来自我训练的网络。因而深度学习试图解决机器学习中最难的人类问题之一:从数据中学习最优表征。处理大量数据很简单,但是特征学习就更像是一门艺术而非科学。深度学习是要实现那门艺术的部分自动化。

    我们不仅取得了算法上进展,更让它得到了广泛的使用,例如Caffe、 TensorFlow、Theano、Scikit-Learn、MXNet、CNTK等等。

    人工智能并不局限于学术界的计算机科学研究者,而是像Pete Warden所展示的那样,越来越多的人都能够参与进来。你无需了解如何实现一个复杂的算法并让它在你的硬件上运行得多么好。你只需要知道如何安装库并标注训练数据就行了。

    正如计算机革命本身所发生的那样,计算机被搬出了机房并被广大市民所使用,同样的民主化进程正在制造一场人工智能革命。来自许多背景和环境的人利用人工智能做试验,我们将会看到许多新型应用。有些会看起来像科幻小说(尽管自动驾驶汽车被看做科幻小说还只是几年前的事);肯定会有我们甚至无法想象的新应用出现。

    建立知识数据库

    世界充满了“暗数据”:不存在于良好、有序的数据库中的非结构化信息。它在网站上、埋于表格里、被珍藏在照片和电影中;但它不易被机器智能或其他智能所捕获。

    像diffbot和deepdive这样的项目是利用半监督学习来找出非结构化数据中的结构——无论是大量的科学论文还是众多网站的碎屑。一旦他们创建了一个数据库,就能用更传统的工具——API、SQL语句或者桌面应用程序——访问该数据库。

    知识数据库和图表已被应用到许多智能应用中,包括谷歌的知识图谱(Knowledge Graph)。在我们走向聊天应用时,挖掘暗数据并找出其中结构的能力将变得更加重要。在聊天应用从脚本化和目标狭隘型迈向为用户返回任意问题的答案型的道路上,暗数据的有效利用将成为这一转变的关键。

    我们可能看不到这样的应用程序被用于问题“理解”,而是会成为未来辅助技术的中心。它们将依靠已被机器分解并结构化的知识库:其中包含的大量数据将超出人类的标记能力。

    产生结果

    不像人工智能冬天的黑暗时期,那时数据有限、计算机很慢,现在我们到处都能看到成功的人工智能系统。谷歌翻译肯定不会像人类翻译员那样好,但是它经常能够提供一个可用的翻译结果。尽管语音识别系统还没有达到随处可见的程度,也也已经是司空见惯的了,且其准确度令人惊叹;一年前谷歌声称安卓手机可以正确无误地理解92%的问题。如果一台计算机能够准确地将问题转化为文本,那么下一步就是把问题变成答案。

    同样,图像识别和图像处理也已经变得司空见惯。尽管存在一些被广泛报道的尴尬错误,计算机视觉系统能够以在几年前还不可想象的精确度来识别人脸。

    理所当然地,对此问题的适宜约束在其成功中起着巨大作用:Facebook可以识别照片中的面孔,是因为它假定照片里的人很可能是你的朋友。计算机视觉是(或将是)从寻常到可怕等各种层次的人工智能应用的中心。视觉显然是自动驾驶车辆的关键;它对于监控、自动锁定无人机和其他不令人舒服的应用也同样重要。

    深度学习和神经网络在过去的一年里已经吸引了大量的关注:它们已经实现了计算机视觉、自然语言和其他领域的进步。

    然而几乎所有打着机器学习旗号的都是人工智能:分类与聚类算法(classification and clustering algorithms)、各种决策树(decision trees)、遗传算法(genetic algorithms)、支持向量机(support vector machines)、分层式即时记忆(HTM:hierarchical temporal memory)等等。

    这些技术可以被自己使用,也可以与其他技术结合使用。IBM的沃森是集成学习(ensemble learning)一个很好的例子:它是一个基于规则的系统,并依据所要解决的问题来结合使用其他算法。这个规则在很大程度上是手工制定的,而其他算法则需通过精心调整来获得良好效果。

6