最近我反复思考:当下学术界很火的人工智能,真的企业界想要的东西吗?要弄清楚这个问题,要搞清科学家和工程师关心的问题有什么不同、有什么关系。
学术界和企业界的追求是有区别的。中科院有位老师曾对我说:科学研究的目的就是发现“黑天鹅”。所谓的“黑天鹅”,就是很难见到、需要在特殊场景下才能见到的东西。从某种意义上说,科学在技术中的应用就是通过把握科学规律,让常规条件下不容易发生、很难发生的事情,能按照人们期望发生。形象地说,就是可以大批量饲养黑天鹅。
技术走向完善的过程,是遵循另外一套逻辑:重点是排除应用过程中的不确定性干扰的过程,让不期望发生的事情尽量少发生,从而让结果可预期。这样的技术才是成熟的,才有经济型。实际上,追求确定性、让结果可预期,而不是像“守株待兔”那样不可预期,是人类一直以来的追求。例如,原始社会靠打猎、采集为生,而后来发展到以农牧为生,就是农牧生产的可预期性比打猎、采集要好;智能制造的本质也是有效处置不确定因素。
“黑天鹅”的发现到底有多大作用呢?前些天我写过一篇文章《成败对错,皆在场景》。技术价值的大小与科学研究的难度没有必然的关联关系。现实中,很难、很了不起的科学发现不一定有大用处:费马定理、哥德巴赫猜想都是很牛的科学研究成果,但真的很难说有什么大的用处。同样,新一代人工智能的价值与难度无关,关键是用在什么场景。
最近几年,人工智能领域爆出了几只“黑天鹅”。“阿尔法狗”就是典型的一只,其他还包括图像识别、语音识别、语义识别等。我疑惑的就是:这样的“黑天鹅”到底能用在企业界的什么地方?要回答这个问题,似乎要想清楚:人工智能的本质进步是什么?
我有个不准确的想法:这些进步的共性或许是能够模拟人的感觉或感性认识。阿尔法狗其实也不例外。真正的进步应该是自动构造启发函数、以避免不必要的搜索、让搜索更优效率。古人云“善弈者谋势、不善弈者谋子”;所谓的“势”就是一种感觉性的东西,能让人抓住下棋的重点。而启发函数可以理解为对棋“势”的理解。“势”的描述很难。过去是人类把自己的想法赋予计算机,于是有了深蓝。基于存储和计算能力的加强,机器自己可以构筑对“势”的理解。这就是机器学习。
感觉或感性认识的优势之一是应对复杂问题。大约30年前就有人说:智能是在一个大的搜索空间中迅速找到较优答案的能力——谷歌的搜索、语义分析能力,表现的就是这个能力。在此之前,人们往往是靠编码把人类的知识表达给机器,而能够实现编码的知识都是能够说明白的知识、而不是感性知识。从这种意义上说,人工智能的本质进展,是解决了感性认识难以编码的困难。
所以,人工智能有什么用处的问题等价于:当机器能够自动具备一定的感性或者直觉认识,有什么用处?
如前所述,技术或方法的优劣,要根据场景的不同来判断。大体上说,人的日常生活和简单体力劳动主要是直觉和感性认识驱动的;人工智能的几个实用案例包括自动驾驶、机器狗,其实都体现了这个问题。
我们也可以从反面思考:感性或者直觉有什么局限性。我们知道,科学家们却一直追求理性认识。因为理性认识能够看到问题的本质、认识更加靠谱、应用更广泛——这就是我们前面提到的、高新技术必须重视科学的原因。由于现代工业对可靠性的追求很强烈,会推进工作的标准化,进而排斥感性认识中带有的随意性。所以,理性认识与可靠性要求高是联系在一起的。
我想,可以按照人的工作类型,分析人工智能可能的应用场景。下面我尝试着用特定的人物形象,来表述不同种类的智能:
1、“吴淑珍”式的智能
吴淑珍是台湾前“总统”陈水扁的老婆。她通过内线消息炒股,获得了不错的收益。这种“智能”的模式可以归结为:“准确的信息+简单的判断知识”。其实,现代自动化流水线上的操作工按照标准化作业就是这种模式——操作工不应该太随意,而是按照标准化要求操作。如果产线是全自动化的,采用“吴淑珍式”的智能,机器就可以代替人的工作。这就是智能制造:Smart Manufacture。 显然,“吴淑珍式”的智能与人工智能( Intelligent)不是一回事。逻辑上讲,“吴淑珍式”的智能很早之前就能做、可以编码,只是需要高度的自动化为物质基础。其实,只有问题足够复杂时、反应速度要求很快时,“吴淑珍式”的智能才能体现出超越人的能力,从而经济性更好。而智能制造所推崇的定制化生产、高质量要求会导致问题足够复杂,从而让“吴淑珍式”的智能有必要性。
2、“时传祥”式的智能
时传祥是著名劳模,淘粪工人。所谓“时传祥”式的智能就是让机器从事一些简单的体力劳动。这些劳动虽然简单,但让机器去做却并不容易。因为这些劳动面对的外部环境是随机的、开放的,机器需要感知外部环境的能力。刚才讲到,最近的人工智能就是在感知方面出现突破的。这种智能应该是典型的Intelligent。无人驾驶汽车就是这类智能的应用。
3、“南丁格尔”式的智能
南丁格尔是著名的护士。工厂、医院中有大量的工作是保障设备或人的正常运行,就像护士的工作。保障正常运行的前提,是知道什么是正常的、什么是不正常的。这其实也是需要知识的。这些知识多数是可以用程序编码来实现的。但是,有了大数据之后知识的积累和实时应用变得更加容易、经济价值也更大。这种智能更接近Smart。Predix、小秘书功能,应该属于这个范畴。
4、“和珅”式的智能
这种智能的特点是善解人意、琢磨人的想法。谷歌的搜索,微软在开发的“小冰”、“小娜”似乎应该属于这种智能。应该属于Intelligent的范畴。
5、“巴菲特”式的智能。
巴菲特炒股靠的是见多识广、数据准确但繁杂基础上的洞察力。这种智能似乎应该用Wisdom来描述更合适。大数据预测就是这种智能。但在我看来,计算机实现这种智能是很难的,尤其是可靠性很难保证。“巴菲特”式的智能会变成“算命先生”的智能:偶尔算得准,但牛皮吹得很大。学术界可能喜欢这些事情,但这种高不确定性的结果不是企业界真正需要的。现实的做法或许是人机互动的分析:机器提供可能性,人对可能性进行判断。这时,机器是帮助人类发挥智慧。
6、“聂卫平”式的智能
阿尔法狗是典型的“聂卫平”式的智能,特长在于计算。应该属于Intelligent。但是,当问题不是太复杂的时候,用Smart的思路应该也可以。
7、“李白”式智能
用人工智能技术画画、作诗,属于这种类型的智能。应该属于Intelligent的范畴。
从实用性的角度看,1~5的实用性相对较强,6~7的实用性较差、主要是科学家感兴趣。原因是这些问题可以解决社会的需求。特别强调的是:学术界关心的人工智能(Intelligent),主要是用于智能化的产品;制造环节的关联度高的其实是Smart 和非Intelligent。“巴菲特”式智能的技术困难很大,恐怕还是以人机互动的方式、让人的智慧更容易发挥。所以,我总觉得:产业界和政府对Intelligent的价值高估了。
我们人类在解决实际问题的时候,往往是感性认识和理性认识的混合。理性认识是判断对错的,可以说是判断问题的边界;感性认识是寻找灵感的,可以说是进行大尺度优化的。我估计,在人工智能的实际应用过程中,也应该是混合着应用:用明确的知识表达来限定问题的描述,用人工智能技术加快优化的效率。