"大数据”时代的来临,给各行各业带来了根本性变革,让所有人都看到了"大数据”的挑战与机会。对于工业控制行业同样也是如此。本文即从"大数据”技术及其在工控行业中的应用研究的角度来探讨一下"大数据”技术问题。
“大数据”时代的脚步已悄然而至,“大数据”(BigData)已迅速成为近期争相传诵的热门科技概念。未来的十年将是一个“大数据”引领的智慧科技的时代。专家们认为:“‘大数据’技术就是下一个经济、国防、安全、社会活动等领域的制高点!”“大数据”是继云计算、物联网之后信息技术领域的又一热点,“大数据”时代的来临,给各行各业带来了根本性变革,让所有人都看到了“大数据”的挑战与机会。对于工业控制行业同样也是如此。本文即从“大数据”技术及其在工控行业中的应用研究的角度来探讨一下“大数据”技术问题。
一、吹响大数据的集结号
“大数据”(BigData)之所以会成为热点,主要应归因于近年来互联网、云计算、移动和物联网的迅猛发展。无所不在的移动设备、射频识别技术(RFID)、无线传感器每分每秒都在产生着成千上亿的数据,数以亿计用户的互联网服务时时刻刻都在产生巨量的数据,需要处理的数据量实在是太多、增长实在是太快了,而业务需求和竞争压力对数据处理的实时性、有效性又提出了更高要求,传统的常规技术手段根本无法应对“大数据”浪潮。国际数据公司(IDC-InternationalDataCorporation)预计,大量新数据无时不刻不在涌现,它们以每年50%的速度在增长,或者说每两年就要翻一番多。人类社会发展的核心驱动力,目前,已由“动力驱动”转变为“数据驱动”;经济活动重点,已从材料的使用转移到“大数据”的使用。“大数据”正在成为各个业界的焦点话题。2012年1月,在瑞士达沃斯举行的世界经济论坛上,“大数据”是框定的主题之一。该论坛的一份报告——《大数据,大影响》,宣告了“大数据时代”的到来!今天已经进入“大数据”时代,身边的一切都在“大数据”范围内。人们似乎再也没有什么秘密可言,各种信息都暴露在“大数据”之中。“大数据”几乎是无处不在。传统行业创新升级,“大数据”成背后推手!企业必须直面“大数据”的挑战。
二、关于“大数据”的基本认识
2.1“大数据”的定义
什么是“大数据”?从一般意义上说,“大数据”是指那些超过传统数据库系统处理能力的数据,数据量通常在10TB(1TB=1024GB,为1万亿字节)以上。因为数据库、“大数据”已经成为变革的中心,事实上成为一场信息革命,在IT领域、能源业、制造业、零售业、政府管理、科技与国防军事等,“大数据”都改变了整个世界的运行方式。因此,我们称之为“大数据“时代。对于什么是“大数据”,目前业界并没有统一的定义。而根据维基百科的定义:“‘大数据’是指无法在可承受的时间范围内用常规软件工具进行捕捉、管理、处理的数据集合。”从产业角度,常常把这些数据与采集它们的工具、平台、分析系统一起统称为“大数据”。
纵观人类历史,每一次划时代的变革都是以新工具的出现和应用为标志的。蒸汽机把人们从农业时代带入了工业时代,计算机和互联网把人们从工业时代带入了信息时代,而如今“大数据”时代已经到来,它源自信息时代,又是信息时代全方位的深化应用与延伸。“大数据”时代的生产原材料是数据,生产工具则是“大数据”技术,是对信息时代所产生的海量数据的挖掘和分析,从而快速地获取有价值信息的技术和应用。
2.2“大数据”的量级
20多年来,各个领域特别是信息领域的数据量的加速增长,是“大数据”概念产生的基础。专家测算,2000年全球新产生的数据量为1000PB到2000PB,到2010年仅仅全球企业一年新存储的数据量就超过了7000PB。
大数据=海量数据+复杂类型数据。目前全球每年产生的数据量是ZB级,到2015年会达到35个ZB。这表明,海量存储已经达到了ZB级(1ZB=1000PB,1PB=1000TB,1TB=1000GB,1GB=1000MB),对于硬件系统的需求已经超出了传统的设计概念。
2.3“大数据”的特点
国际数据公司(IDC)认为,某项技术要想成为“大数据”技术,必须满足IBM所描述的三个“V”:多样性(variety)、大容量(volume)和时效性高(velocity)。多样性是指数据应包含结构化的和非结构化的数据;大容量是指聚合在一起供分析的数据量必须是非常庞大的;时效性高则是指数据处理的速度必须很快。
具体来说,“大数据”具有4个基本特征:一是数据体量巨大。百度资料表明,其新首页导航每天需要提供的数据超过1.5PB(1PB=1024TB),这些数据如果打印出来将超过5千亿张A4纸。有资料证实,到目前为止,人类生产的所有印刷材料的数据量仅为200PB。二是数据类型多样。现在的数据类型不仅是文本形式,更多的是图片、视频、音频、地理位置信息等多类型的数据,个性化数据占绝对多数。三是处理速度快。数据处理遵循“1秒定律”,可从各种类型的数据中快速获得高价值的信息。四是价值密度低。以视频为例,一小时的视频,在不间断的监控过程中,可能有用的数据仅仅只有一两秒。
2.4“大数据”技术的构成
如果说“大数据”是一种技术,又具体包括哪些技术?专家认为,“大数据”技术由四种技术构成:它们包括:分析技术、存储数据库、NoSQL数据库、分布式计算技术。
各种研究表明,“大数据”是与智能制造、无线网络革命并行的又一次颠覆性的技术变革。其具体内容包括:海量数据分析技术、“大数据”处理技术、分布式计算技术、数据可视化技术。
三、美国正在全面推进“大数据”研发
2012年3月29日,奥巴马总统发布《大数据研究和发展倡议》,开启了美国“大数据”全面研发工作,“大数据”作为信息时代获取、处理与利用信息的一项核心技术,正改变着国家安全、社会经济发展乃至人类生活的各个方面,已成为信息时代大国竞争的一个战略性的新领域。美国甚至流行一句谚语叫“除了上帝,任何人都必须用数据来说话”。美国政府把“大数据”看成是“未来的新石油”。
美国政府宣布“大数据研究和发展倡议(BigDataResearchandDevelopmentInitiative)”,来推进从大量的、复杂的数据集合中获取知识和洞见的能力。《大数据研究和发展倡议》提出,将提升美国利用收集的庞大而复杂的数字资料提炼真知灼见的能力,协助加速科学、工程领域创新步伐,强化美国国土安全,转变教育和学习模式。《大数据研究和发展倡议》还承诺将在科学研究、环境保护、生物医药研究、教育以及国家安全等领域利用“大数据”技术进行突破。
该倡议涉及联邦政府的美国国家科学基金(NSF)、美国国家卫生研究院(NIH)、美国能源部(DOE)、美国国防部(DOD)、美国国防部高级研究计划局(DARPA)、美国地质勘探局(USGS)等六个部门。这些部门承诺将投资总共超过两亿美元,来大力推动和改善与“大数据”相关的收集、组织和分析工具及技术。在这份倡议中还透露了多项正在进行中的联邦政府各部门的大数据计划。主要内容如下:美国国家科学基金和美国国家卫生研究院主要推进大数据科学和工程的核心方法及技术研究,项目包括管理、分析、可视化、以及从大量的多样化数据集中提取有用信息的核心科学技术;国防部高级研究局项目主要推进大数据辅助决策,集中在情报、侦查、网络间谍等方面,汇集传感器、感知能力和决策支持建立真正的自治系统,实现操作和决策的自动化;美国能源部试图通过先进的计算进行科学发现,提供2500万美元基金来建立可扩展的数据管理、分析和可视化研究所;美国地质勘探局通过给科学家提供深入分析的场所和时间、最高水平的计算能力和理解大数据集的协作工具,催化在地理系统科学的创新思维。
四、“大数据”技术在工控行业中的若干应用研究
4.1在电力行业的若干应用研究
在电力行业,坚强智能电网建设及“三集五大”管理体系的决策部署,对数据的管理、共享及互操作提出了更高的要求。电力行业面临着正在形成的大数据环境,为此,需要不断挖掘大数据环境下的业务数据处理的潜在需求,探索适应电力数据的理论和方法,使得电力信息系统的运维的外延向数据运维的范畴进一步地拓展。以更好地适应数据量的迅速增长、数据类型的多样化、数据时效性不断提高。
以智能电网为例,电网互联是电力系统发展的客观规律,有必要加强研发大规模互联电网的安全稳定运行技术、先进可靠的配电网与共用技术及微电网技术为主的分布式电力系统。因此,采集、分析并有效应用“大数据”是解决能源与公共事业关键业务的重要因素,可以实现向智能电网转型、改善分布式可再生发电的资产预报与调度、提高发电效率以及改变客户运营模式。
《大数据时代》的作者舍恩伯格说,可以抽象地认为,智能电网就是“大数据”这个概念在电力行业中的应用,就是通过网络将用户的用电习惯等信息传回给电网企业的信息中心,进行分析处理,并对电网规划、建设、服务等提供更可靠的依据。同时,对于风能、太阳能等具有间歇性的新能源,通过“大数据”分析进行有效地调节,也可以使新能源更好地与传统的水火电进行互补,更为灵活地出力。在本质上,智能电网是“大数据”在电力上的应用。在电力行业,坚强智能电网的迅速发展使信息通信技术正以前所未有的广度、深度与电网生产、企业管理快速融合,信息通信系统已经成为智能电网的“中枢神经”,支撑新一代电网生产和管理发展。
“大数据”与电网的融合可组成智能电网,涉及发电到用户的整个能源转换过程和电力输送链,主要包括智能电网基础技术、大规模新能源发电及并网技术、智能输电网技术、智能配电网技术及智能用电技术等,是未来电网的发展方向等。电力企业是不是符合“大数据”应用的企业?享誉信息产业界多年的梅特卡夫定律指出,网络的价值与联网的用户数的平方成正比。随着电力工业与信息化的深度融合,智能电网将承载着电力流、信息流和业务流,电网和电力信息通信网的用户将发生叠加,电网的整体价值会跃升。这种价值的跃升将使电力企业具有大数据的时代特征。电力信息通信将突破传统运维、产生更多的增值服务,甚至催生新的管理模式创新。数据中心将被赋予更多的职能,比如强大的数据挖掘、数据分析和决策能力。电力企业业务数据主要来自生产数据和运营管理数据。电力企业生产数据既包括发电量、电压稳定性等实时采集的数据,也包括物联网、云计算、新能源并网、移动互联、电动汽车充换电、车联网等技术带来的新数据业务。电力企业运营管理数据,则包括交易电价、售电量、用电客户、ERP、一体化平台、协同办公等方面的数据。如能充分利用这些基于电力生产、使用等实际数据,对其进行深入分析,便可以提供大量的高附加值服务。这些增值服务将有利于电网安全检测与控制,客户用电行为分析与客户细分,电力企业精细化运营管理等,实现更科学的需求侧管理。数据、信息和知识的“按需分配、恒值供给、多次挖掘”将成为新经济形态的不竭动力,而“大数据”技术和应用成为决策的辅助系统。
“大数据”时代对电力行业发展提出新的挑战,但也带来新的发展机遇。通过良好的数据管理,并运用数据挖掘手段践行大数据战略,将切实提高电力生产、营销,以及电网运维等各方面生产管理水平,为使中国电力企业继续立于世界先进行列提供强大的信息技术支撑。
据悉,2013年3月,中国电机工程学会电力信息化专委会拟编制发布《中国电力大数据发展白皮书(2013)》,这将是我国首次就电力“大数据”问题发布的白皮书。作为电力信息化专委会秘书处所在单位,国网信息通信有限公司承担白皮书的调研和编写工作。白皮书全文12000余字,分为引言、迎接电力“大数据‘时代、展望电力“大数据”时代、迈向电力“大数据”时代、结束语等五部分。这充分表明,电力工业作为国家基础性能源设施,与社会发展和人民生活息息相关,是国民经济社会健康稳定持续发展的重要条件。积极应用“大数据”技术,推动中国电力“大数据”事业健康发展,对实现中国电力工业科学发展具有极大的现实意义。
完全可以预期,“大数据”技术的在电力行业中的应用研究,仅仅是开始。随着电力行业的不断发展,“大数据技术”应用,将会不断扩展与深化。
4.2有助于提升工控行业的“洞察力”
所谓“洞察力”,指的是人对任何特定情况作出预见的能力。在企业管理上,“洞察力”更意味着管理者必须拥有以数据为基础、深入观察分析,透过现象看本质、将理论应用到实际工作中的能力。随着数据总量的持续增长和急速膨胀,“大数据”时代已经来临,2013年电力、石油等能源细分行业纷纷拉开了“大数据”开发应用的序幕。“大数据”技术强调的是从海量数据中快速获取有价值信息的能力,如何从海量数据中高效获取数据,有效地深加工并最终得到有用的数据是能源企业涉足“大数据”的目的。“大数据”是以大量资料为基础,以更加科学的方式,进行分析、洞察的创新能力。实际上,进入“大数据”时代以来,现代企业正经历着规模化、多样化高速化的数据挑战。越来越多的管理者开始意识到,若无法对海量信息进行有效的分析处理,预测出潜在的业务风险,便容易在竞争中处于劣势;若无法通过有效的沟通,确保洞察到的信息被较好地执行,则可能致使企业商机的流失。
未来,企业会依靠洞悉数据中的信息更加了解自己,也更加了解客户。在这个瞬息万变的时代,面对各种随时可能发生变化的形势,管理者不妨使用“以洞察获取先机、用沟通确保执行”的方式,制定各种应对战略,保证企业这艘“大船”平稳行驶,在不断的竞争中获得胜利。企业管理公司SAP(全球知名的企业管理和协同化商务解决方案供应商)曾做过一项调查,发现在任何行业中,将最具竞争力的企业与最不具竞争力的企业相比,前者的员工受到更强洞察力的影响的比例是后者两倍,由此可见,强大的洞察力对企业竞争优势起推动作用。
归根到底,“大数据”的最终意义在于获得提升“洞察力”的能力和价值。移动互联时代,数据已经被认为是宝贵资源,任何一家有雄心、渴望获取洞察力的企业,都应及早制定“大数据”战略和方案。否则,所有的机会将被“数据鸿沟”所延宕。
4.3“大数据”的核心:更准确地预测企业数据
在“大数据”时代,数据与机器将在人类的日常决策中占有重要的地位。未来,人类必须学会如何和海量的数据相处。从个体角度而言,人类需要学会如何平衡个人直觉与数字证据之间的关系;从企业与组织角度而言,人类需要探索企业组织架构和决策流程与数据之间的关系;从创新角度而言,人类需要探索如何打造合适的产业环境,促进更多的创新的“大数据”应用的诞生。“大数据”时代,海量数据处理与挖掘的技术固然十分重要,但是,更为重要的因素仍然是人。只有人,才能利用新技术与新方法创造性地搜集与探索数据中隐含的意义;只有人,才能最大限度地发挥数据的作用,在机器与数据的支持下更有效地决策。换句话说,“大数据”的核心:是要求更准确地预测企业的数据。为了适应“大数据”时代的来临,企业需要从管理者的思维方式、企业的组织架构和信息环境等多方面进行改变以与之相适应。
企业“大数据”的应用一方面是与宏观经济、人民生活、社会保障、道路交通的信息融合,促进经济社会发展;另一方面,是各个行业或企业内部,跨专业、跨单位、跨部门的数据融合,提升行业、企业管理水平和经济效益。
4.4数据挖掘技术在工控行业里的应用
数据挖掘,又称为知识发现(KnowledgeDiscovery),是通过分析每个数据,从大量数据中寻找其规律的技术。利用大数据可对业务进行分析,加工成有用的数据,进而全面掌控企业业务。对电力行业来说,大数据是电力企业深化应用、提升应用层次、强化集团企业管控的有力技术手段。随着电力企业各类IT系统对业务流程的基本覆盖,采集到的数据量迅速增长。电力行业面临的问题不仅仅是收集和存储数据,而是围绕数据采用相应的定量和统计信息,挖掘更加有价值的信息。如国网信通公司在北京亦庄的数据中心里,就设有10200个传感器,它们及时采集数据,存储到云并进行分析和利用。
数据挖掘是从海量实际应用数据中,提取隐含在其中的、潜在有用信息和知识的过程,是一个知识发现过程。整个过程分为业务理解、数据理解、数据准备、建立挖掘模型、评估和部署六个步骤。即在开始数据挖掘之前,我们必须了解业务需求,根据需求明确挖掘主题、要求和最终目标;接下来便是对现有数据进行评估,并对原始数据进行组织、清理、集成、变换等一系列数据收集和预处理工作;在搞好数据治理的基础上,便可应用数据挖掘算法和工具建立挖掘模型;之后对所建立的模型进行评估,重点具体考虑得出的结果是否符合最初的业务目标;最后,便可将发现的结果以及过程利用各种可视化技术(报表、报告、图形等)呈现出来。
4.5工控行业的“大数据”应用案例
工业控制系统中“大数据”的应用研究。现举例如下:
案例之一,《SCADA系统中大数据处理的研究与开发》
在SCADA(SupervisoryControlAndDataAcquisition)系统,即数据采集与监控系统的实际应用过程中,由于很多应用企业的数据采集点很多,同时由于应用方面的实际需要,通常需要把采集的数据保留一段很长的时间,用于查询、分析和统计。另一方面,很多数据的采集要求实时性较高,需要保持着较高的采集频率,从而,数据库中的数据势必会越来越多,因此,在保证系统稳定与正常访问的前提下,将不可避免地面临着大数据的处理问题。
如:某城市供水管网数据SCADA系统中有多个水厂,每个水厂有多达上百个数据采集点,包括了水温、水流量、水压力、水位以及其它多项监测数据。针对此类问题,在不改变数据采集周期、不增加硬件设备的情况下,通过优化数据结构和算法,完全可以达到提高数据访问速度、提高系统运行效率的目的,可具体进行优化。
案例之二,《大数据推动自动化和信息化融合》
2012年9月20日,“第二届云计算大会暨大数据高峰论坛”在北京召开。在此次以“云计算与大数据融合发展方向”为主要探讨话题的高峰论坛上,与会嘉宾北京首钢自动化信息技术有限公司总工程师郭雨春做主题演讲。
郭雨春认为,“纵览首钢对数据应用历史,原来数据是一种资料,到后来变成资源,到现在是一种资产。”“两化融合在制造业来讲应该是比较新的课题,结合企业的信息化,从管理角度来讲,应该是精细化管理,从生产流程来讲应该是产业升级。这两个都离不开自动化和信息化支持。建立数字化企业是两化深度融合必然结果,而其中最关键的是数据。因为两化融合进程中,首先要提到就是自动化和信息化之间关系,就是因为有大数据,有了数据的融合,所以才出现了自动化和信息化的融合。”毫无疑问,大数据创业的前景十分广阔,“看不见的数据,看得见的价值”正给新兴的通过数据创业的公司带来难以估量的市场潜力。
案例之三,《“大数据”支撑智慧城市建设》
未来智慧城市的建设将带来数据量的爆发式增长,“大数据”将像血液一样遍布智慧交通、智慧医疗、智慧生活等智慧城市建设的各个方面,城市管理正在从“经验治理”向“科学治理”转变。智慧城市是否真正“智慧”源自“大数据”,如何挖掘海量数据的潜在价值并为城市治理提供可靠决策和建议,成为智慧城市建设的关键。专家建议,中国必须抓住“大数据”时代的机遇,挖掘海量数据的潜在价值,进而推进智能城市建设。
结合智慧城市对信息的需求,“大数据”在智慧城市中的落脚点为——为智慧城市的各个领域提供强大的决策支持。在城市规划方面,通过对城市地理、气象等自然信息和经济、社会、文化、人口等人文社会信息的挖掘,可以为城市规划提供强大的决策支持,强化城市管理服务的科学性和前瞻性。在交通管理方面,通过对道路交通信息的实时挖掘,能有效缓解交通拥堵,并快速响应突发状况,为城市交通的良性运转提供科学的决策依据。在安防与防灾领域,通过大数据的挖掘,可以及时发现人为或自然灾害、恐怖事件,提高应急处理能力和安全防范能力等。
中国工程院院士邬贺铨在2013年1月11日举行的《2013中国智慧城市年会》上说:“‘大数据’挖掘对智慧城市的经济发展和社会管理是无形的生产资料,‘大数据’价值的合理共享和利用将创造巨大财富。”邬贺铨认为,智慧城市是城镇化进程的下一阶段,是城市信息化的新高度,是现代城市发展的愿景。智慧城市在产生大数据的同时,“大数据”也支撑着智慧城市的建设和发展。
五、“大数据”技术应用的局限性
这里,我并不是想说大数据分析不是一个好的工具。而是想说,就像任何好的工具一样,它有它所擅长的地方,也会其局限的地方。而世界正因为不能单从一个方面解释而显得有趣。
5.1就像任何工具一样,“大数据”分析也有其局限性。
“大数据”的局限性是算法不能完全代替人的判断。实际上“大数据”在很多方面都无法取代人类的智慧和判断,“大数据”可以处理大量非结构化数据,弥补管理者过于依赖直觉的不足;但是人们也应当意识到,“大数据”也有很多不擅长的地方:例如,无法对“情感”和“社会关系”等进行定性分析,原始数据和分析结果会受到人类主观意识影响;又如,“大数据”不擅长上下文情景分析;再如,“大数据”不擅长处理真正的巨型问题;还如,原始数据往往会被扭曲,数据分析的结论往往基于大众偏好。
“大数据技术目前存在局限性,还不适用于所有企业。“大数据”最美的地方,就是我们不再受数据容量的局限,它可以不断的增加一些变量,然后增加价值,帮助我们做出更好的决策。
斯坦福大学专家特来沃尔•哈斯蒂也指出,“大数据”的理论是“在稻草堆里找一根针”,而面临的问题则是“所有稻草看上去都挺像那根针”。而乔治•梅森大学专家瑞贝克•高尔丁则提出“数据提供者造假”的危险,在“大数据时代”变得更有害,因为“大数据”理论建立在“海量数据都是事实”的基础上,但人们无法控制数据提供者和搜集者本人的偏见和筛选。近年来已有不少学者指出,拥有最完善数据库、最先接受“大数据”理念的华尔街投行和欧美大评级机构,却每每在重大问题上判断出错,这本身就揭示了“大数据”的局限性。
5.2企业信息安全成为重大问题
“大数据”堪称一把双刃剑,不论是企业还是个人,都会因为“大数据”的爆发而获益匪浅,但同时,个人隐私也无处遁形。站在不同的角度看“大数据”,它既可能是大机会、大发展、大创新,也可能是大危机、大破坏、大淘汰。由于“大数据”炙手可热,数据的流失、泄露和私下买卖也成为噩梦,全球各地不时发生的个人信息被盗可被看作“大数据时代”对个人生活的伤害,而“维基泄密事件”则提醒强力部门和各国政府,“大数据”的魔力同样会对强者构成反啮。数字世界扩大的同时也意味着危险随之扩大。最近,通过美国人斯诺登的持续爆料,“棱镜门”公之于众,全球在感到触目惊心的同时,也不得不对美国收集数据的广泛和浩瀚叹为观止。美国政府的神通广大,一部分就是基于“大数据”。进入2013年6月,美国“棱镜门”事件不断发酵,为全球信息安全敲响了警钟。“棱镜”折射出的隐忧:大数据时代你我都是透明人!未知的安全威胁,让人不寒而栗。
数据已经成为“企业的命脉”。然而,我们既不应该过分迷信大数据、将现有非“大数据”技术马上弃之不顾,也不应该将一切问题都推在“大数据”身上。很显然,传统技术不会瞬间“过时”、新技术也无法一手遮天。
5.3“大数据”理论并非人人相信
然而“大数据”概念似乎正被不顾后果、毫无章法地过度使用;即使偶尔使用方法对路,其适用范围也并不像技术人员想象的那么宽泛。例如:美国学者就质疑过“大数据”理论。微软研究院首席研究员、麻省理工学院公民媒体中心客座教授凯特•克劳福德的文章《对大数据的再思考》,就从五个方面对大数据理论提出了质疑:
(1)大数据中存在偏见和盲区。克劳福德认为,数字无法自己说话。不论其规模有多大,数据集归根到底是人类设计的产物,而大数据的工具并不能使人们摆脱曲解、隔阂和错误的成见。
(2)大数据在一定程度上可以使城市变得更加智能和高效,但具体效果如何取决于市政官员对数据及其局限性的了解。
(3)大数据可能导致基于群体的歧视。大数据的倡导者认为,“大数据对不同的社会群体不会‘厚此薄彼’”,克劳福德认为,实际情况并非如此。大数据不仅不会避免群体歧视,还可能加重这一趋势。
(4)隐私泄露是大数据应用中的重要问题。克劳福德认为,大数据的倡导者关于“大数据是匿名的,因此它不会侵犯我们的隐私”一说是大错特错。
(5)大数据为科学研究提供了新的途径,但不可断言“大数据是科学的未来”。克劳福德称,大数据的研究方法只能统计某件事情发生的频率和相关性,但不能得出因果关系。将大数据策略和小数据研究相结合也许是更好的科学研究途径。现今对于“大数据”的预测或悲观或乐观,它究竟会如何改变人类社会,我们还将拭目以待。但是,专家认为:“大数据”的创新性、先进性与前瞻性,是值得肯定的。因此,辩证地看“大数据”对人类活动的影响才是正确地。
5.4“大数据”概念常常被过度滥用
“大数据”这个概念常常被过度滥用,要么就是被完全错误理解。对于某个特定应用程序中数据量的增加而言,无论这种增长幅度有多么迅猛,我们都不能就将其称之为大数据应用。我们需要做的是对这套系统进行扩容,而这个过程根本没那么复杂——只需做一些设计调整,如果系统本身就预留了扩展设计,连调整都不需要。不过,一些学者指出,由于“大数据”理论过于依靠数据的汇集,那么一旦数据本身有问题,在“只问有什么,不问为什么”的模式下就很可能出现“灾难性大数据”,即因为数据本身的问题,而导出错误的预测和决策。
“大数据”在业务层面也给企业带来多重挑战,其中三条最为紧迫。一是法律环境的缺失和民众不客观的情绪。在欧盟,什么是信息隐私、什么是信息安全是有明确规定的,有很明确的规范。美国的互联网企业比较强势,通常是做了再说,如果出了问题会通过游说国会,通过立法的形式加以肯定、保护。但是在中国,从整体上相关法律是缺失甚至说是空白的,电信运营商既没有法律规范作为依据,也做不到像美国的运营商和互联网企业对政府拥有强势的影响力。
六、结束语
根据IDC预测,中国的“大数据”市场从2012年到2016年将增长5倍,政府、电信、能源、银行等将是最先使用“大数据”工具的行业。还预测,未来三年我国“大数据”市场将突破百亿元。整个行业发展空间巨大。毫无疑问,“大数据”创业的前景广阔,“看不见的数据,看得见的价值”正给新兴的通过数据创业公司带来不可估量的市场潜力。
“大数据”时代的到来,充满了机遇与挑战,谁能够最快地习惯这种新形式下的数据模式,熟悉和掌握处理这种数据处理方法,谁就会在之后的信息争夺战中占得先机,取得主动权。“大数据”引领我们走向数据智能化时代,“大数据”时代将会智谋未来!得“大数据”者得天下!中国的工控行业应当在“大数据”浪潮里,迎头赶上,夺取胜利果实。