【编者按】Google I/O大会正在如火如荼的召开,一些重要的信息也被一一披露,Google技术基础设施部高级副总裁UrsH?lzle在大会的主旨演讲上表示,当数据规模达到数PB级字节,MapReduce处理起来将变得非常困难,他表示Google已经停用MapReduce几年了,他们目前开发并发布了新的超大规模云分析系统Cloud Dataflow。本文来自DataCenterKnowledge。
免费订阅“CSDN云计算”微信公众号,实时掌握第一手云中消息!
CSDN作为国内最专业的云计算服务平台,提供云计算、大数据、虚拟化、数据中心、OpenStack、CloudStack、Hadoop、Spark、机器学习、智能算法等相关云计算观点,云计算技术,云计算平台,云计算实践,云计算产业资讯等服务。
以下为译文:
2014谷歌I/O上的Google Cloud Platform和Cloud Dataflow
Google已经停用自己研发的,部署在服务器上,用以分析数据的MapReduce,转而支持一个新的超大规模云分析系统Cloud Dataflow。
MapReduce一直是服务器集群上做并行分布式计算的一个非常受欢迎的基础架构和编程模型。它是被广泛部署并已经成为很多公司商业产品的大数据基础架构平台Hadoop的基础。
但是近日,这项技术已经不能处理谷歌想要分析的大量数据。技术基础设施部高级副总裁UrsH?lzle表示,一旦数据规模达到数PB级字节,处理起来将变得非常困难。
“我们已经不再使用MapReduce。”H?lzle在周三于旧金山举行的谷歌I/O大会上发表主题演讲时表示,公司已经在几年前停止使用这个系统。
Cloud DataFlow,将作为一项服务提供给使用它们云服务的开发者,这些服务并没有MapReduce的扩展限制。
“Cloud Dataflow是这近十年分析经验的成果。”H?lzle说,它将会比现存的所有的系统运行的更快,更易扩展。
“这是一个完全托管服务,它可以自动优化、部署、管理以及扩展。它使开发人员对批处理和流媒体服务能够使用统一编程轻松地创建复杂的管道。“他表示。
所有这些特点,谷歌认为在MapReduce上无法完成:很难迅速获取数据,不能进行批处理和流处理,而且经常需要部署和运行MapReduce集群。
H?lzle在展示会上也宣布谷歌云平台上其他一些新的服务:
原文链接:Google Dumps MapReduce in Favor of New Hyper-Scale Analytics System (编译/晓晓 审校/魏伟)