行业趋势
联想集团是全球知名的科技公司,同时自身也是IT产品制造企业。自2011年起联想开始启动大数据体系建设,在企业内部广泛实践,作为企业转型升级的重要推动力。自2016年初开始成立联想大数据部门,整合全集团的大数据专家人才,吸收外部专家,服务于联想内部大数据持续建设,也启动了对外商业化业务。
工业大数据是大数据和智能制造两个国家战略的交汇点,前景巨大,这是最好的时代。在大数据和工业结合方面,联想深刻认知到数据智能的价值。数据智能成为联想大数据的核心理念。
数据智能的价值
数据如水。数据来源于业务,数据也应作用于业务,并形成一个价值闭环。未来企业、未来世界是架构在软件上的,是软件定义的,而数据就是企业软件体系的血液。在更宏观层面,大数据的竞争,是企业信息话语权的竞争,行业上下游之间、企业各级组织之间,掌握数据就掌握了主动权、话语权,赢得长久的竞争力;另一方面,不同部门、企业和产业之间的信息互动和分享,进一步释放数据价值和生产力,同时也是在促进信息的公平。
数据智能的价值如何获取?一方面来源于“数据”的广度,一方面来自于“智能”的深度。这可以组成一个二维矩阵。传统的业务分析应用,绝大部分是基于业务表象数据的简单分析和呈现,可以认为是数据智能的初步阶段。但不要小看这一步,现阶段众多企业的数据价值,百分之六七十甚至更多都来自此。
随着技术的发展,从数据整合的广度和数据挖掘的深度这两个角度带来的价值越来越多的被人们认可和发现。以广度而言,最典型的是智慧城市中跨部门的多元数据的整合分析,将各政府部门的数据整合关联起来,即使还未做大量深度挖掘,就已经可以看到数据价值的几何式增长。而就深度而言,最耳熟能详的是AlphaGo这个围棋圣手了,基于简单数据和简单规则,通过深度学习算法应用,挑战了人类智慧的最后一块阵地。人工智能像圆的直径,每向前突破一小步,整个数据体系的价值就发生一次巨大的扩展。
工业智能的挑战在于,在当前数字化、网络化的生产水平还不足够强壮的大背景下,既要实现对数据的获取与整合,这本身就是一个非常艰巨的任务;还要高投入产出的深度挖掘数据的价值,实现敏捷分析。而工业的细分行业的垂直性和专业性,让这项工作难度陡增。因此必须让大数据专家和制造行业专家紧密合作,通过相当长周期的协同研究,采用人工智能的新武器打破现有的工艺或生产瓶颈。
数据智能的构成
联想在实践数据智能的过程中,也面临这两方面的挑战。联想的研发、生产、供应链及销售体系遍布全球,我们需要整合来自全球的各个生产车间的数据、各地区和业务的供应链数据、十几亿的设备数据、以及全球的消费者数据,也有来自网络上的新闻、评论、客户反馈等数据。我们通过几年的努力,建成了全联想统一的大数据平台,称之为LUDP——Lenovo Unify Data Platform。
企业经常会碰到一个问题,该整合哪些数据?因为这需要花费大量投资来进行获取和存储,后面要花更多的精力将这些数据进行关联。根据联想的经验,需要按照整个企业的发展目标和应用目标去有序建设。咨询规划的步骤是不可或缺的。
敏捷智能是企业的大脑,而且是一个针对业务问题进行敏捷思考的大脑。相对于数据整合工作而言,分析更应该是灵动而有效的。工业大数据的建设必须从大处着眼、小处着手。如何摆脱数据分析的盲目性?毕竟数据科学家的投资是非常昂贵的。这需要一个业务架构过程,企业需要根据自身行业和企业的实际业务特征,将战略目标一层层细化到分析目标上,最终落在通过数据来分析、求证和发现的分析问题上,最终形成一张企业自身的应用地图,并制定实施计划。根据这张地图可以有序指导数据整合,将有效的资源投入在敏捷智能上,去应对企业需要急迫解决的问题。
在具体实现数据智能时,可以划分为三个主要部分:
第一,通过数据湖实现数据整合,形成全企业数据的统一资源整合处理中心。Data Lake并非很神秘的概念。这是随着数据管理和应用技术发展,就像从数据库发展到数据仓库一样,数据湖是进一步演化,或者某种程度上的颠覆,是包含了大数据新技术、新架构、新工具、新方法的数据管理体系(图1)。
图1 数据湖Data Lake
第二是AI技术的应用,这里包括视觉技术、自然语言处理、语音识别和预测算法等等,还包括一些传统的数据挖掘模型(图2)。
第三是Application,应用驱动建设。联想大数据起步比较早,一开始是在内部使用,必然是通过业务需求来驱动的,通过一步步的数据价值验证,得到整个公司对数据价值的认可。虽然大数据理念现在已经如火如荼了,但对于某些数据文化比较薄弱,还踌躇不前的企业,可以借鉴我们的做法来推动公司数据智能的转型。
这三部分也凸显了企业大数据建设的三个主要的能力:IT/DT能力、分析能力、业务能力。通过数据湖方面形成统一的数据分析中心,通过业务需求锁定价值应用方向,中间通过敏捷智能分析将数据快速、有效的转化为解决问题的知识和方法。
图2 业务价值驱动的AI分析应用
整个数据智能驱动工业转型升级的过程中,需要注意两个链条:第一,从自动控制视角来看,强调CPS的3C要素,可连(Cyber)、可通(Communication)、可控(Control)。第二,从数据智能视角,要实现企业数据化(Digital),形成可管理的数据资产(Data),最终去实现数据的决策(Decision)。这两个链条是互通的,最终实现理想状态下的从数字化开始、到智能化的自动控制反馈结束的智能控制闭环。双链驱动的数据智能,无论设备级、还是工厂级,以及上升到企业级,随着数据智能成熟度的不断深化,双链驱动的模式成为智能制造企业的DNA。
此外,因联想大数据支持联想全集团的生产运营,所以从广义大数据的范畴来讲,企业内部的财务数据、供应链数据、销售数据、客户体验数据等,包括做市场研究时需要的外部宏观数据、供应链上下游的数据以及社交数据等,都是工业大数据需要思考和服务的范畴。
联想数据智能实践
目前联想建成了十个全球化数据中心,对全球化生产经营进行统一的数据管理,联想全球的数据湖平台居功至伟。罗马不是一天建成的,联想统一的数据平台是不同时间、在不同地区、在不同的法律要求下、采用不同的商业建设模式逐步建设。我们也采用了私有云和公有云结合的混合云模式。目前这套庞大的体系在我们大数据部门的运维下高效支撑业务。举个简单的例子,我们面向全球的手机销售激活分析是非常重要的运营监控指标,目前手机激活数据可以5秒刷新一次,也就是说基于遍布全球的10个数据中心,我们每5秒将最新的新增手机用户统计一次。
我们以敏捷分析为应用理念,积极支持业务变革,从研发开始,到生产,到渠道销售,到最后的客户使用的反馈数据,前后建立了300多个大型专题分析。我们的MQM(持续质量管理)专题,通过2周的实验数据来预测全年的维修率,准确率达到95%,并且深入到产品质量问题的根因分析,为品控和售后带来了巨大的价值。
从联想的数据智能软件产品的逻辑组成来讲,我们商业版LEAP(Lenovo Enterprise Analytic Platform)产品家族有四项重点:LEAP Edge、LEAP AI、和LEAP APP。整个过程从边缘段的分析计算到整个企业级数据的整合应用,以及数据应用之后再反馈到生产运作过程中,形成数据智能驱动闭环(图3)。
图3 联想大数据LEAP产品家族体系架构
联想大数据商业化实践也在短期内获得了成功,活的业界广泛认可。
在汽车后市场,数据智能帮助客户实现敏捷商业运营,帮助客户构建客户画像、销售预测,通过外部数据来洞察产品舆情;在冶金行业的质量检测方面,联想数据智能助力钢厂实现冷轧厂钢材生产质量的实时智能检测,基于机器视觉技术数字化缺陷,并通过人工智能算法对质量分体进行识别和分类,并进一步改进生产过程和工艺提升;在烟草行业的制丝车间,通过对30多个影响烟草质量的参数进行敏捷分析,提升稳态识别的准确率,提升生产质量。
联想集团还拥有广泛的技术生态合作伙伴。联想创投旗下大量的科技型被投公司与联想大数据的优势技术、分析专家和交付团队结合,为客户、合作伙伴提供端到端的产品和服务。联想和客户伙伴的合作不仅仅局限在技术能力,更多在业务理解,并和行业专家一起构建一个更宏大的生态。这个生态有利于去消除信息鸿沟,助力中国制造2025的蓬勃发展。
本文根据联想大数据高级总监温天宁在2017(第二届)工业软件与制造业融合发展高峰论坛上的发言整理而成。