当今世界,新一轮科技和产业革命正在蓬勃兴起。数据是基础性资源,也是重要生产力。
大数据技术,就是从各种类型的数据中,采用新处理模式快速获得有价值的信息,从而实现深度理解、敏锐发现与精准决策。目前,大数据产业已渐趋成熟,亟待被各行各业所运用。
我国发展大数据产业还面临着“信息孤岛”的挑战。跨部门、跨行业的数据共享仍不顺畅,有价值的公共信息资源和商业数据开放程度低,基本处于死锁状态,无法顺畅流动。
新一代信息技术与经济社会各领域的深度融合,引发了数据量的爆发式增长,使得数据资源成为国家重要的战略资源和核心创新要素。据统计,全球所掌握的数据,每18个月就会翻倍。到2020年,全球的数据量将达到40ZB,其中我国所掌握的数据将占20%。
世界经济论坛创始人兼执行主席克劳斯·施瓦布新著《第四次工业革命——转型的力量》一书近来在决策层、知识界、经济界引起反响。该书提到未来影响整个人类发展的23项技术变革中,运用大数据进行决策在列其中。
数据正成为国家发展重要战略资源。国务院总理李克强在发往2015贵阳国际大数据产业博览会贺信中明确表示,当今世界,新一轮科技和产业革命正在蓬勃兴起。数据是基础性资源,也是重要生产力。
突起大数据可预知未来
当前,信息化已经从提升效率的工具转变成为社会发展的基础和支撑,云计算、大数据、移动互联等新一代信息技术打破了原有技术壁垒,形成了新型的产业和商业创新模式,有效降低创新门槛,能够带来更为公平、开放、透明的市场环境,同时也推动数据成为重要的生产资料。
工信部信息化和软件服务业司司长陈伟在此前接受媒体采访时曾表示,利用大数据分析,能够总结经验、发现规律、预测趋势、辅助决策,充分释放和利用海量数据资源中蕴含的巨大价值,推动新一代信息技术与各行业的深度耦合、交叉创新。大数据的发展将对经济社会发展乃至人们的思维观念带来革命性的影响,同时也能够为国家发展提供战略性的机遇。
随着我国经济发展进入新常态,大数据将在稳增长、促改革、调结构、惠民生中曾担越来越重要的角色,在经济社会发展中的基础性、战略性、先导性地位也将越来越突出。同时,大数据也将重构信息技术体系和产业格局,也为我国信息技术产业的发展提供巨大机遇。
事实上,围绕大数据发展的竞争不仅将决定国际信息产业格局,还将深刻影响国家安全与综合竞争力。推动大数据发展,提升我国在大数据技术研发、领域应用、产业发展、安全保障、法律标准、人才培养等方面的总体实力和综合竞争力,是推进我国经济增长和转型升级、促进政府管理和公共治理变革、解决发展方式转变深层次矛盾、实现国家治理能力现代化的有效路径和战略抉择,是助力我国从“数据大国”向“数据强国”转变的必由之路。
“大数据是信息化发展的延伸。”中国信息通信研究院移动与大数据部副主任魏凯在接受记者专访时表示。他直言“大数据”这一概念与日常生活是息息相关的,无论是政府办公、企业运转,还是车间生产、物流运输,每天都有大量的数据生成。当各行各业的数据累积到一定规模,数据存储、管理、挖掘、应用等新技术,就能帮助我们“把握现在,预知未来”。电信运营商就依靠大数据技术,在智能交通、舆情分析、电商精准营销、精准广告等传统业务方面,开辟了新路。
我们将更全面地了解正在发生什么,了解身处其中的这座城市,并作出预测性的维护或改善。”魏凯举例,智慧出行或智慧交通,依据的正是运营商的数据,它能够提前告知堵点,让人们有计划地出行,缓解城市道路交通拥堵。“而基于大数据之上的公交一卡通刷卡记录或手机通话等,可以知道某个地点在某个时段人口迁移情况,这个动态的海量信息是人工不可能做到的。”魏凯说。
其实,在预知未来方面,腾讯、阿里、百度等大型互联网企业引领着大数据应用的前沿,不仅在社交、电商、广告、搜索等业务上越来越深入地使用大数据技术,还以大数据为核心引擎发展金融、交通、医疗、教育等跨界应用。例如,百度公司利用大数据技术,可以实时展示流感等流行病的动态,预测发病趋势,为应对疫情变化,优化医疗卫生资源配置提供了有力帮助。
形势初始阶段的三个梯队
所谓的大数据技术,就是从各种类型的数据中,采用新处理模式快速获得有价值的信息,从而实现深度理解、敏锐发现与精准决策。根据埃森哲的相关数据,目前,大数据产业已渐趋成熟,亟待被各行各业所运用。
而一般认为,大数据产业包含硬件、软件和服务3个部分。据Wikibon公司2014年年初发布的报告,2013年全球大数据相关硬件、软件和服务市场规模为181亿美元,同比增幅长了61% ,增速是同期IT 产业的6倍。预计2017年市场规模将达到470 亿美元,年度复合增长率将维持在30%以上。
如果从互联网公司引领大数据技术前沿突飞猛进来看,大数据技术创新水平也呈3个阶梯。第一梯队以谷歌为代表,在大数据技术上处于绝对领先地位;第二梯队是Yahoo、Facebook 、Twitter 等一大批互联网企业;第三梯队是IBM 、Oracle 等传统IT 厂商,他们能够在开源技术基础上进行改进,与行业应用系统紧密结合,快速形成一般企业可直接使用的商用产品。
不过,在魏凯看来,目前全球大数据行业发展整体还算是处在初始阶段。不过可能不同的行业和地区发展也有差距。以企业数量、研发实力和市场的应用的程度,目前来看,全球大数据发展大致分为三个梯队,美国以绝对实力引领整个行业的发展。而中国以一批成熟公司形成的完整体系算第二梯队,接下来是欧洲和日本等细分领域比较强,但没有完整的产业体系。
事实上,仅就国内大数据发展也分化明显。北京、上海、广东,浙江等以拥有大批科技人才以及有较为良好的硬件和发展环境而走在全国前列。而贵州、内蒙古等凭借能源、地理位置及地方政府在支持大数据产业和应用发展等方面很有特色,属于第二梯队。其他地区属于第三梯队。
“目前,我们已支持和指导北京、上海、贵州、广州、陕西等地大数据产业和应用发展,这些地方先行先试,主动探索,已初见成效。如我们支持和批复贵阳贵安大数据产业集聚区创建工作,在出台产业扶持政策、开展数据共享交易、法律法规等方面成效显著。授予陕西省西咸区创建软件和信息服务(大数据)示范基地,鼓励当地大数据产业创新发展。”陈伟表示。
此外,经过各方的共同努力,我国大数据得到了快速发展。产业规模不断扩大,在部分关键技术上实现突破,涌现出一批骨干企业。阿里公司根据中小企业的交易情况对银行的财务和诚信情况进行筛选,并提供无担保的贷款。目前,已累计发放贷款2000多亿元,服务80余万家企业,有力缓解了中小企业融资难的问题。工商总局联合浪潮,利用大数据对市场主体进行分析得出:近一年来,全国新登记市场主体超过60%保持活跃状态。
“云计算、大数据本身也推动产生了大量数据,为创新提供了重要的资源。我们坚信数据是未来社会的重要生产资料,必然存在交易,为此我们建设了卓数大数据交易平台。目前该平台拥有19类39PB数据,聚集近8000交易用户,2万多用户在线使用这些数据。依托卓数平台,贵州、济南、重庆、北京、沈阳等地与浪潮合作建设大数据创客中心,将卓数平台数据资源、研发工具、云服务资源免费开放给创客,为创客节省创业成本数亿元。”浪潮集团董事长兼CEO孙丕恕此前向记者透露。
困局信息孤岛普遍存在
在利用云计算、大数据推动商业模式创新方面,很多政府都带头示范,进行了卓有成效的探索尝试。山东省政府联合46家单位信用数据,建设省级公共信用信息系统,目前已采集近1000万条数据,向政府部门、第三方信用服务机构提供开放服务,并与信用中国进行数据对接。2月23日,郭省长率队到浪潮集体学习时,明确要求年底前实现所有非涉密行政许可事项全部网上办理,加快政府数据开放。
但是像这样公共数据开放的正面事例还不算常态。在很多情况下,我国发展大数据产业都要面临着“信息孤岛”的挑战。跨部门、跨行业的数据共享仍不顺畅,有价值的公共信息资源和商业数据开放程度低,基本处于死锁状态,无法顺畅流动。
对此,魏凯直言,地方政府拥有非常丰富的数据资源,也需要运用大数据来提升治理效率。通过向社会开放数据、加强与社会企业和组织的数据合作、向社会购买服务等方式,推动环保、医疗、教育、交通等关键领域的大数据整合与集成应用,提高政务和公共服务效率。
引起“信息孤岛”的另一个原因是大数据产业标准的不统一,无形之中增加了企业使用数据的成本。魏凯介绍,可以从三个方面评判一款大数据产品。安全性,主要是数据加密、权限管理、数据安全保护;易用性,企业运维的成本非常高,要很简易地部署;稳定性,产品不容易受到攻击。评价这些性能需要一把尺子,数据中心联盟就在做这把“尺子”,制定了一些标准。
此外,当前不少人对大数据产业发展规律认识不足。全社会尚未形成对大数据产业发展规律的客观、科学的认识,一些地方误将数据中心建设视为大数据产业发展重点,盲目追逐硬件设施投资,轻视了数据资源汇聚、积累、处理与应用能力建设,未能主动推进大数据产业发展与应用需求间的对接。
另外,我国技术创新与支撑能力也不足。大数据需要从底层芯片到基础软件再到应用分析软件等信息产业全产业链的支撑,无论是新型计算平台、分布式计算架构,还是大数据处理、分析和呈现方面与国外均存在较大差距,难以满足各行各业大数据应用需求。
最后是,信息安全和数据管理体系尚未建立。数据所有权、隐私权等相关法律法规和信息安全、开放共享等标准规范缺乏,技术安全防范和管理能力不够,尚未建立起兼顾安全与发展的数据开放、管理和信息安全保障体系,制约了大数据发展。
配套完善大数据体系建设
对制造业企业而言,大数据技术的战略意义不仅在于掌握庞大的数据信息,更在于对数据的“加工能力”——对大量的数据进行专业化的处理,使之转化成为对企业有用的信息。制造业企业如果能够在工业环境中建立起大数据平台,提高工厂对不同设备收集的海量信息进行梳理的能力,提高企业信息系统的计算能力和数据消化能力,实现对企业的产品数据、运营数据、销售数据、客户数据的实时而有针对性的分析,并用其指导下一轮的研发、生产、销售和服务,这将会使得企业能够在低成本运营的同时,有效实现按需生产,从而在实现绿色生产的同时,提高企业的经营效率。这是真正的可持续发展。
“现实的应用层面会有很多问题:需要数据的人拿不到数据,结构性的短缺问题非常严重;对传统企业来说,大数据技术门槛高;因为大数据应用还处于起步阶段,企业还看不到其中的利益增长点。”魏凯表示,数据中心联盟要做的,正是产业急需的事情:一是与用户单位、大数据厂商一起制定大数据相关产品规范、评测的方法,提升国内大数据产品的研发水平;二是在不违规、不违法的前提下,推动数据跨行业、跨部门流动。“这其中一个重要的环节,就是标准的完善和统一,不然没法互联互通。”魏凯说。
事实上,大数据标准化是信息技术领域的新热点,也处于刚刚起步阶段。我国作为核心成员,和美、英、韩等国家合作推动了国际大数据标准化工作。国际标准化组织ISO/IEC JTC1于2014年成立了专门负责大数据国际标准化的大数据工作组(ISO/IEC JTC1 WG9),目前正在研制《信息技术大数据概述和术语》和《信息技术大数据参考架构》系列国际标准。我国专家承担了《信息技术大数据概述和术语》联合编辑工作。此外,美国国家标准与技术研究院(NIST)于2013年6月成立大数据公共工作组(NIST NBD-PWG),也在积极探讨大数据标准化,完成《大数据定义》、《大数据分类》等7项输出物V1.0版本,为我国标准化工作提供了很好的参考。
另外,在工信部和国标委的领导下,2014年12月2日全国信息技术标准化技术委员会大数据标准工作组(以下简称“工作组”)正式成立,统筹开展我国大数据标准化工作,大数据工作组组长由上海交通大学副校长梅宏院士担任。目前,工作组包括了北京大学、阿里、华为、京东、国家信息中心等近150家申请单位,共同形成了“大数据标准体系”,正在研制的国家标准有10项。
据悉,围绕大数据标准化,下一步国家将重点开展以下工作:一是推动标准体系建设,推进数据格式接口、开放共享、数据质量、数据安全、大数据平台等重点标准研制;二是加强标准验证和应用试点示范,建立标准符合性评估体系,推动标准对产业和应用的支撑作用;三是继续积极参与国际标准化制定工作。
另外,大数据系统安全体系的建立是一个系统性的工程,需要国家从法律法规、行业规范以及技术手段等多方面对个人隐私数据进行监管和保护。未来将加强技术攻关,形成信息安全技术体系;加强行业规范和行业自律,加强应用中的个人隐私保护,平衡公共利益与个人隐私;推动个人信息保护相关标准出台和认证体系建立。