工业大数据与数据驱动的智慧
2017年9月2日,由中德智能制造联盟和e-works数字化企业网联合主办的2017(第二届)工业软件与制造业融合发展高峰论坛在北京辽宁大厦隆重召开。会上清华大学软件学院院长王建民教授做了题为《工业大数据与数据驱动的智慧》的演讲,本文根据演讲内容整理而成。
下面(图8)是波音的一个图。随着空客的崛起,九十年代的波音危机四伏,订单下降,美誉度也随之下降。它当时的一个老板叫武达德,上台之后就特别注重波音信息系统的建设,成功解决了信息孤岛的问题。我觉得这个老板最具前瞻性的是什么呢?就是把数据放到了中心。他把产品数据、工艺数据、项目数据等都放在了一起,然后在数据集上搞业务。从客服销售那儿开始,然后再到客户,端到端的服务模式,是流程围着数据转。这也给我们一个启示:信息系统就是数据和流程的一个综合体,流程是产生消费数据的一个来源,数据是支持流程无缝、高效运行的原材料,谁也离不开谁。
图8 ‘过程为中心’与‘数据为中心’对比分析
工业大数据实施策略研究
工业大数据到底该如何发展?其实国际上有一个领域叫过程挖掘,也就是增加对过程数据的利用,使其更加智能化,对此我谈谈自己的理解。我觉得IoT+ABC是工业大数据中数据管理的一个场景。数据库和大数据的区别就在于,数据库是先有模式后有数据,而大数据采集的数据是在设备中产生的,是先有数据,后有模式,可以称之为IOT。
接下来讲讲数据集,数据集是一种重要的资产管理,因此我们需要构建数据集的BOM。我们所讲的机器学习、人工智能、深度网络,都是从数据集里学习出来的模型。这个模型就是从一个数据集X,在知道Y的情况下,求F函数的过程。这就是采集、管理、处理、分析。其中最核心的问题就是应用,分为四个层次:采集部分、管理部分、数据集部分,应用部分,这些部分是逐渐深入和智能化的。PTC的领导曾写过一篇文章,讲到未来制造业里的工业智能分四个层次:监视、控制、优化、自主。
下面谈一点感受,原来我们做信息化的时候,用的是C语言,而现在做数据分析用的是R语言、Python语言,用的是分布在互联网上的很多的软件包。正因为有大量的、开源的软件生态,才支撑了ABC、IOT的蓬勃发展以及智能制造的蓬勃发展。
图9 数据、模型与算法
后面简单跟大家汇报一下数据算法和模型算法。上面图形中,最左侧的三列就是数据,而红红绿绿的,蓝红相间的就是模型。模型主要是起到分类的作用,就是画边界。比如上面的SVM算法,决策树算法,随机森林算法,AWS的算法,不同的算法做出来的模型是不一样的,而最终这些模型都要以应用为依据。所以,AI和大数据的基本区别就在于大数据能把这个模型做出来,而AI是把这个模型再嵌到设备里去。
工业大数据创造价值的过程才刚刚开始,工业大数据的价值不仅在于对现有业务的优化,更在于支撑企业、行业乃至全社会的创新、转型和发展。伴随着工业互联网不断普及,工业大数据应用价值将逐步释放、智能制造也将得到长足发展。当前,工业大数据仍处在高速发展的历史阶段,其概念内涵、技术方法、价值创造模式还在不断创新演化之中,需要我们各位共同地努力和大胆地创新实践。
本文为授权转载文章,任何人未经原授权方同意,不得复制、转载、摘编等任何方式进行使用,e-works不承担由此而产生的任何法律责任! 如有异议请及时告之,以便进行及时处理。联系方式:editor@e-works.net.cn tel:027-87592219/20/21。