关于人工智能的想象有着两种形态。
一种在传媒及人文等公众端口,呈现的是一种基于对未来科技跃迁的不可预测的恐慌情绪,匹配这些想象的有大量的文艺作品,比如威尔?史密斯主演的《我,机器人》、施瓦辛格主演的《终结者》以及丹?西蒙斯所著的科幻史诗《海伯利安》等,其传递的普遍忧虑在于人工智能的失控是否最终会威胁到人类文明自身的生存。
另一种形态,是在学术和科研等专业端口,从业者们的困惑是奇点的闪烁使其隐瞒了真实的距离感,计算机的解题能力及其效率——比如微积分、海量计算甚至国际象棋——远超人类极限,但是迄今为止没有任何智能机器能够精确辨认“猫”这种动物,这可是三岁的人类小孩就能轻易做到的事情。
美国最富盛名的计算机科学家之一唐纳德?克努特是这么说的:“人工智能已经在几乎所有需要思考的领域超过了人类,但在那些人类和其他生物不需要思考就能完成的事情,仍然差距巨大。”
在经历人工智能(AI)与智能增强(IA)——后者其实就是将计算机等科技作为人类行为的延伸,将智能放置在辅助角色上——两大流派的漫长斗争之后,人工智能从狂热回归务实的原因其实源于生物科学对人类大脑的研究逐步深入,人脑的神经元网络尽管在传输速度上远低于计算机的CPU,但超大型并行计算的规模和能力却超过了计算机所能构成的物理网络。
简单来说,现有阶段的人工智能,要在单点胜过人类是很容易的,但是人脑拥有先天性的适应能力,它支撑着人类的复杂情感,比如安慰他人、书写诗歌、临场应变以及海阔天空的对话沟通,这让机器很难模仿得来,因为后者只能遵循事先编写的程序和规则行事。
于是,人工智能领域开始将“深度学习”作为一种赋能,用于制定相关产品的标准。用Google前任CEO艾瑞克?施密特的话来讲,“计算机无法复制一套人类大脑的神经元,我们只能让机器尽量去学习。”
而与美日等国不同的是,中国互联网在商业应用层面的发达,使人工智能在被冠以“下一个风口”之名过早的置于商业市场,这种做法究竟是“快字诀”的伟大实践还是又一次揠苗助长的泡沫制造,可能尚且有待观察。
本文的主角,是处于风起云涌的机遇舞台中央,一家以“计算机之父”图灵的名字命名的创业公司作品:图灵机器人。
人工智能的路径分化
上周,三十岁的俞志晨在北京国家会议中心发布了一款以人工智能为基础的机器人操作系统:Turing OS,此时,距离他在3W咖啡面对不满100人的观众宣布创建图灵机器人项目,刚好一年。
图灵机器人的前身,是搭载与智能手机系统的虫洞语音助手产品,其与科大讯飞的业务相仿,试图对接企业成为人机交互的技术支持。在拿到中国移动网上商城提供的奖金之后,他和团队才有了注册公司所需要的第一笔资金。
说是Siri带动了整条语音交互产业也毫不为过——唯有用户需求的大量激发才会驱使产业链不同环节的逐利跟进——虫洞语音助手很快获得了接入主流消费产品的机会,车载电脑、企业客服、智能家电均在合作对象的范畴以内。就在俞志晨戒掉微博之前,他还密切的测试HTC的语音助手“小hi”,与后者在微博上频频互动,并兴致高昂的发布了“小hi PK小冰(注:微软的聊天机器人产品)”的话题。
但是,这种以信息服务匹配为核心的人机交互愈是普遍,其面目就愈是固化,可塑性的缺失是不可逆的,而人工智能更是被人力运营取代,这个品类下的不少产品开始养起运营团队,去和握有商业资源的互联网公司交换数据,同时将未来寄托在O2O这种变现明朗的模式里。
就像上文所言,学界通常警惕技术提早浸染商业的风险,认为这会偏离预定轨道,从而失去进步和突变的可能,即使是在Google这种商业公司里,技术部门也都被战略保护得相对较为纯粹,毋须承担货币化的使命。人工智能在中国的“返祖”,也令人想起“土耳其傀儡”的故事:
十八世纪末,一个名为沃尔夫冈?冯?肯佩伦的奥地利男爵为了取悦王室,而设计出一个“拥有智慧”的巨型器械,这个器械的外型酷似土耳其传统打扮的魔术师,肯佩伦声称它和人类对垒国际象棋。神奇的“土耳其傀儡”迅速走红,被他在棋局上胜过的人甚至包括法国皇帝拿破仑和美国发明家富兰克林。直到一百年后,才有媒体发现这个“土耳其傀儡”的运作原理其实就是在里面藏了一个棋艺高手——通过魔术的障眼法使人们进行参观和检查时发现不到这个人的踪迹——然后以磁铁进行信息传递,告知里面的人棋盘动向,再操作傀儡落子。
人工智能不应重蹈“土耳其傀儡”的覆辙,它不应由人力来完善自身所长,而应拥有自我演化的基因,兼具人类的思维能力、情感能力和学习能力。得出这一结论之后,俞志晨以虫洞语音助手为基础启动了新的项目,也就是图灵机器人,他希望摆脱“助手”的工具设定,继续探测人工智能的“拟人”进程。
听懂中文是最高的技术挑战
俞志晨的年龄,很容易受到舆论质疑:在人工智能这个仰仗积淀的行业,三十岁还是太过年轻,无论职业履历多么专注,都很难通过资历来说服外界。
因此,在与资本接触时,俞志晨只能反复阐述图灵机器人的成绩:逾10万合作方,响应请求量达1300亿次,中文语义识别的准确率超90%……而在蓝图的规划上,这个项目也表现出与同类产品脉络迥异的想象。
图灵机器人可被视作是虫洞语音助手的升级版本,它是一个技术接口,主要作用是模拟人类的语言认知和交流行为,在对话问答、NLP知识库和生活服务技能三个方向提供支持。在这个层面,响应品质是竞争的关键,俞志晨将图灵机器人称为“中文语境下智能度最高的机器人大脑”,其信心源自他在模糊数学和机器翻译方面的研究。
俞志晨在北京交通大学的老师是贺仲雄,后者是中国模糊数学的奠基人。所谓模糊数学,其实指的是通过数学方法解决抽象问题的学科,它所对应的则是计算数学。一个姑娘的体重可以基于计算数学获得,但她长得是否漂亮,这就成为一个模糊概念,机器很难进行准确判断。相比英文体系,缺乏逻辑的中文词性更具模糊特征,这是开发人工智能与中文对话时常会出现纰漏的场景。
根据俞志晨的说法,图灵机器人在人机交互领域的对标,是IBM旗下著名的人工智能系统Watson,后者是IBM在语义分析上重金投入的集大成之作,最大的特色就是能够读懂英文语言里的隐喻、双关甚至笑话。与之相仿,图灵机器人目前可以通过记忆系统读懂“主谓宾”缺省的对话,比如在被询问某处的天气之后,用户在下一次发问时只用说出或是输入另一处地点,图灵机器人会联系上下文做出“这是新的一次天气询问”的判断,并回推结果。
而在图灵机器人之外,俞志晨最近一年开发的拳头产品,是Turing OS,这是一个在真正意义上服务机器人商品的解决方案。
操作系统的场景价值
一直以来,日本都是一个机器人大国。1999年,索尼推出的经典商品Aibo机器狗——Aibo就是“Artificially Intelligent Robot(人工智能机器人)”的缩写——这款昂贵的商品(售价600美元到2000美元不等)总计卖出了15万套,而购买者多为缺少亲人陪伴的孤巢老人,这也成为映射日本老龄化社会的一种特殊符号。在2014年索尼宣布终止为Aibo机器狗提供技术支持之后,日本甚至产生了仿生宠物医疗产业,专门用来服务那些“年限过高”的故障机器狗。
社会学家预言由于特殊的人口政策,中国在未来很有可能也会步日本后尘,但在现今,因为父母忙于事业而在幼年阶段缺少陪伴的孩子仍然是一个社会性的隐忧。而俞志晨的解法,是将Turing OS这套基于人工智能的操作系统授权给研发机器人硬件的企业,合力推动智能机器人与人类的融合。
与多数人工智能应用需要依靠版本迭代才能完成更新的规则不同,Turing OS可以吸收外部的声音、文本、图像甚至肢体语言来获得自我学习的适应能力,并以情感思维与用户发生互动。俞志晨希望这套操作系统能够配合前端的硬件产品忠实履行“儿童玩伴”的职责,包括英文跟读、拟真陪聊、知识传授、信息查询等功能,在一定范围内弥补部分儿童群体早期社交不足的弊病。
俞志晨的实用主义,或许来自法国知名机器人公司Aldebaran的作为。Aldebaran旗下的三款机器人产品,皆以伴侣身份设计,“NAO”主打早期教育市场,曾被证明在帮助自闭症儿童克服病理性障碍上有着杰出表现,而“Romeo”是用于帮助缺乏自治能力的老人,在老人发生意外时可以做出及时的救助反映,“Pepper”则属于日本软银公司的定制产品,功能均衡,既可被商家用来放在店铺门口招揽顾客,也能进入家庭成为一个独特的非血缘成员。
Turing OS与Aldebaran开放的人工智能操作系统NAOqi OS有着相同的诉求,即以平台级的生存方式充当底层,左边衔接机器人等硬件应用,右边管理功能性质的软件应用,合力扩大机器人的使用场景。
以及……
俞志晨非常赞同经济学家郎咸平的一段发言:“人才需要被工序化,需要被制度化,如果人才的知识不被工序化和制度化,那么当人才流失的时候,那么科技就无法被积累,所以高科技所更应该重视的是工序和积累而不仅仅是创造。”在他看来,人工智能永远不会有决出胜负的一天,因为这个行业就像永恒的光影变化那样没有戛然而止的终点,只有无限的投入和多变的回报。
而在对竞争力的诠释上,他只用了两个词语来概括:坚持和耐心。