该服务是在六月份宣布的,当时IBM承诺将投入3500名员工到Apache分析项目,Spark也成为IBM分析和商务平台及其Watson Health Cloud的基础。
Spark即服务将提供保留实例的功能,但是对于大企业来说并没有批量折扣。
IBM表示,Spark就像是MapReduce——一种规模几乎无限的架构——能够对大规模数据处理带来革命性的改变。当然,Spark在某些地方开始取代MapReduce。
没有更多的专利框和芯片组,也不需要火箭科学家构建高性能集群;这是针对那些不愿支付企业级价格的人,那些以日用品化了的x86集群为王的人的分析。
但是,自从IBM郑重其事地推出Spark——它于2009年被创造出来,并于2013年被接纳进入Apache开源“名人堂”——之后,出现了很多改变。
亚马逊透露它正在致力于自己的分析即服务Space Needle,该服务是在本月早些时候在AWS上推出的。亚马逊已经进入企业市场一段时间了,取代了现有的基础架构供应商——例如IBM之类的厂商。现在它正在更上层楼,进入应用程序和拥有大把现金的商业智能和分析应用程序领域。
S3、Redshift和Aurora已经成了“积木”。上周,亚马逊对华尔街表示,Aurora现在是该公司历史上增长最快的业务——已经超越了Redshift。Aurora是AWS的MySQL兼容数据库引擎。
AWS掀起的这波浪潮迫使SAP提前发布了自己的分析即服务业务——Orca项目。
分析对于用户来说并不是一个友好的世界。应用程序非常昂贵,很多顾问的价格也非常高,这有点像ERP或者CRM,最终软件从来无法完全达到最初的期望。你开始部署它的时候,它就已经过时了。
AWS表示这是民主的东西——这要归功于其超低的价格,易用性、灵活的体系架构。亚马逊已经迫使IBM在自己的后院——企业市场——展开竞争,在它一直以来都认为是自己的游戏中竞争:数据和分析。
那么IBM希望如何阻挡这个巨头,不让数据走进杰夫.贝索斯的云里?
蓝色巨人的豪赌?
IBM推出Spark即服务并不仅仅是为了堵住其商业智能和分析应用方面的漏洞,而且旨在建立工具和合作伙伴关系。因此,Spark的开放源代码的性质就很重要,因为每个人都可以开发代码和工具,插入其他基于Spark的工具和框架。
在这方面,IBM下注自己可以复制本世纪初在Eclipse工具框架上取得的成功。IBM对Eclipse倾尽心血,把它变成了一个Rational工具的框架,并且在过程中实现了几个重大改变:它降低了建设自己Rational IDE的价格,让竞争对手支持Eclipse框架,从而也支持了它自己的平台和运行时。
Eclipse建立了一支ISVs建设工具大军,这些开放源代码的工具都支持IBM。但是开放破除了今天云计算的冰山一角,这就是IBM的理论和Eclipse过去分解带来的经验。
OpenStack意图成为AWS的开放替代品,但是OpenStack公共云是“可折叠”的——惠普刚刚关闭了自己的“百叶窗”。
例如AWS之类的专有平台正在取得胜利,只要它们披着支持开放源代码操作系统、语言和中间件的外衣。
没有人因为购买IBM开放源代码软件而被解雇,对不对?
IBM的云数据服务总经理Derek Schoettle反驳说,开放很重要:AWS是私有的,而且是不完整的。有了IBM的Spark意味的不只是选择,还代表着让平台变得更完整的机会,从用户界面到处理引擎,以及AWS中缺乏的一切东西。