一方面Spark在这一年发展迅猛,作为利用内存进行处理的开源框架,在我们发表旧版本蓝图时就开始引起众多的议论。此后,Spark受到了从IBM到Cloudera等各种玩家的欢迎,并取得了相当大的认可度。Spark的意义在于它有效地解决了关于让Hadoop有所延缓的一些关键问题:它运行快了很多,更容易编写程序,良好的机器学习适用性。
另一边,在数据库领域里,NoSQL与NewSQL正在不断融合。NoSQL数据库们纷纷开始支持SQL,而PostgreSQL、MySQL甚至Oracle都开始支持JSON格式存储。因此,数据库领域目前“分布式”、“SQL支持”以及“多类型存储”这几点成为了数据库的最新的必备项。此外,新兴的参与者比市场以容纳的量似乎出现的更多,同时有很多令人兴奋的事情在发生:从图形数据库的成熟、专业数据库的兴起再到另外,数据仓库也同样在不断发展发展。
大数据分析:AI与大数据分析结合
在过去的几个月里,大数据分析的最主要趋势,是与AI人工智能的结合上。AI与大数据分析的结合,这有利于帮助大量数据的分析,从而得出预测的结论。AI真正帮助人们实现了最初预想的“大数据的功能”,AI和机器学习在数据分析领域就代表了大数据下一步进化的方向。近期的AlphaGo的成功,就是AI与大数据有机结合的最好体现。
同时,对于大数据BI领域,AI的出现也大大提高了BI智能化的脚步。不断成熟的AI,可以帮助人们处理数据,计算公式,最终统计和分析出一些特定的适合的模型,这就做到了之前的数据科学家在建模中的许多工作。
大数据应用:加速落地
既然一些核心基础架构的挑战已然突破,应用层的大数据也随之正在迅速建立起来。
值得一提的是大数据应用两大趋势:
首先,会有许多许多“大数据原生”应用程序,他们由自己最新的大数据技术建成,并代表了一个有趣的,为客户提供利用大数据而无需自行部署底层大数据技术的方式。
其次,人工智能在应用程序层面上也体现出了强大的表现。在许多依赖于AI的大数据应用中,AI的自动化程度已经接近于100%,甚至于很多场景下大大超过了人工操作的效率和准确性。
大数据市场:不断成熟
对于大数据的生态,我们可以从资本市场就可以很好的判断整个市场和生态的情况。第一波的大数据技术公司,基本都在2009~2013年成立,而至2015年以来,大多都经历了多轮的投融资,也在技术产品和业务方向上趋于稳定。整个2015年,大数据领域的VC投资额度为66.4亿美金,占到了整个科技界投资的11%以上,这足以说明问题。另一方面,用户侧对于大数据的需求不断增加。根据IDC的调查数据,到2015年全球新兴大数据市场规模已经到达330亿美金的规模,在未来3年内市场规模更将突破500亿美元。
中国大数据:机遇挑战并存
看完了硅谷评选的大数据地形图,作为一个中国的大数据厂商,也是唯一上榜的中国大数据厂商。我们既感到开心,也感觉到任重道远。