最近在思考一个问题:应用大数据技术时,应该先考虑什么问题?
绝大多数朋友都是按照这样的逻辑考虑的:1、对象(过程、企业、设备)有什么数据?2、这些数据能为我们带来什么知识和信息。3、如何应用这些数据创造价值。
这个思路听起来是天衣无缝的。但我的思考习惯思路与这个不太一样。我习惯的逻辑是:1、企业有什么业务或商业模式创新的打算?现在的业务有什么痛点? 2、如何用数据支撑创新、消除痛点?3、投入产出值得不值得?
其实,20年前,我和同事有过一场类似的争论:做研发应该从需求出发,还是从方法出发。例如,我们是应该把某个专业方法搞得很精,再去找有需求的应用场景;还是先找到有问题的应用场景,再去找合适的专业方法去解决。20年来,我一直坚持我的观点。道理很简单:我是在企业里面搞研发;在企业做研发,困难往往在找到合适的需求;只要找到了需求,很多方法都能解决、也很容易找到掌握方法的人。形象地说,就是:“钉子太少、锤子太多”。这大概就是技术人员和科学家的区别:科学家关心的主要是造出很好的锤子,根本不去管谁去用它钉钉子;或者说你就是一个知名的大牛,一大堆的钉子正在等着你的锤子。
回到前面的问题:大数据问题,到底应该从数据出发,还是从业务需求出发?我的感觉是:“数据中包含什么信息或知识”,往往很难回答。特别是:有些大数据的案例简直就像算命,让人觉得目瞪口呆。原因是:如果数据中的信息很容易提取,别人老早就利用起来了。根本用不着今天来考虑。
而如果从业务需求出发,去考虑需要采集什么样的数据、如何采集数据,预期就很容易实现。因为数据设置和采集是为业务需求量身定制的,数据的质量和数量都会好得多,数据分析的难度就会大大降低、分析的结果就是可以预期的——如果是不可预期的,这个业务就是有问题的。事实上,新的业务需求对数据的应用来说,是个大的蓝海。所以,从数据出发就像狩猎(甚至可能像守株待兔),能得到多少是不清楚的;从业务出发就像农耕,收获基本靠谱。换句话说,两者的差别在于成功的概率不一样。
当然,从业务出发是有前提的:人们能够通过数据的布置达到业务目的,而不是只能用已有的数据做工作。我能理解,有时候人们不得不从数据出发:就像把人一下子置身于森林里,你只能赶紧去打猎:等庄家熟了,人也饿死了。
我一直强调:工业大数据要与工业互联网和智能制造结合起来,要与企业的转型升级结合起来、要和推进服务型制造结合起来,其实就是这个道理。有了新的业务,大数据应用才会有蓝海,才能避免在红海中搏杀。