企业级大数据供应商Cloudera宣布该公司刚刚完成一笔9亿美元的融资,通过观察Hadoop领域的3大知名初创公司Cloudera、Hortonworks及MapR的融资对比,我们相信随着这些初创公司融资规模的不断扩大,Hadoop生态圈将愈加繁华;另外,本周还有一个消息值得关注,那就是Oracle2013年在软件方面的总收入为297亿美元,超过IBM跃居软件行业第二,这对于Oracle也应该具有里程碑意义;当然还有云计算时代IT专业人员需要具备哪些技能,2014值得关注的开源软件等等。
企业级大数据供应商Cloudera宣布该公司刚刚完成一笔9亿美元的融资,这个金额包括了这个月 19日收获了1.6亿美元(T. Powe Price 领投、Google Ventures 等跟投的1.6亿美元),以及近日刚刚确认从Intel手中取得的7.4亿美元融资,芯片巨头则获得了大数据先锋18%的股票。
Cloudera成立于2008年,专注于Hadoop开源技术的企业级应用,其创始团队成员来自 Google、Facebook、Yahoo!、Oracle 等多家知名IT企业,而目前Cloudera的解决方案已为AOL、CBS、Ebay、摩根斯坦利、迪士尼等公司重度使用。
该公司最近一笔融资该归结于2012年的6500万美元,其A、B、C三轮融资分别为2009年的500万、2010年的3600万(A轮投资人的融资)、2011年的4000万美元,而,这个Hadoop企业级服务提供商更计划在2014年实现IPO。
还值得关注的有:微软继续保持第一的位置,年收入高达657亿美元,与去年的620亿美元上涨6%。Salesforce.com,自称“软件终结者”的公司,也首次进入十大软件公司行列。
谈到IT专业技能,人们往往想到软件、硬件、网络、编程语言等等,甚至以为考个证书在手就万事大吉,其实不然,那么在竞争非常激烈的云计算时代,IT专业人员到底需要具备哪些技能,才能确保自己紧紧跟上时代的脚步,不被时代淘汰。
作者列举了10项技能:商业和金融技能、技术技能、企业架构和业务需求分析、项目管理技能、合同和供应商的谈判技巧、安全性和遵从性、数据集成和分析技能、移动应用开发和管理、熟悉开放混合云的知识、了解OpenStack。
Ceph,当下已成为OpenStack上最通用的存储之一,也是是目前人气最高的开源存储项目之一。Ceph是一种为优秀的性能、可靠性和可扩展性而设计的统一的、分布式的存储系统。Ceph项目起源于其创始人Sage Weil在加州大学Santa Cruz分校攻读博士期间的研究课题。
项目的起始时间为2004年。在2006年的OSDI学术会议上,Sage发表了介绍Ceph的论文,并在该篇论文的末尾提供了Ceph项目的下载链接。由此,Ceph开始广为人知。Ceph使用C++语言开发。对于一个典型的强调性能的系统项目,这一选择可以理解。作为开源项目,Ceph遵循LGPL协议。根据Inktank官方网站上的信息,Cpeh的生态系统参加下图:
事实上,Ceph最初针对的目标应用场景,就是大规模的、分布式的存储系统。所谓“大规模”和“分布式”,是指至少能够承载PB级别的数据,并且由成千上万的存储节点组成。
在大数据口号深入人心的今天,PB已经远远不是一个激动人心的系统设计目标了。但是,应该指出,Ceph项目起源于04年。那是一个商用处理器以单核为主流,常见硬盘容量只有几十GB的年代。这和现在动辄6核12线程还要双处理器、单块硬盘3TB已经司空见惯的情况是不可同日而语的。因此,理解这个设计目标,应该考虑当时的实际情况。当然,如前所述,Ceph的设计并没有理论上限,所以PB级别并不是实际应用的容量限制。
5.皮皮网陈超:易用与性能兼备,Spark蓬勃发展!
陈超就职于皮皮网,担任数据平台负责人,负责公司所有数据分析与数据挖掘相关的项目。近年来一直专注于分布式计算与机器学习相关领域。国内较早的Spark研究与使用者,Spark
Contributor。目前专注于基于Spark平台的大数据处理。
Spark在机器学习方面有着无与伦比的优势,特别适合需要多次迭代计算的算法。当然Spark的容错和调度也自有其特点和优势。最后Spark能把批处理和流处理做到一个很好的平衡。
Docker是一个开源的应用容器引擎,让开发者可以打包其应用以及依赖包到一个可移植的容器中,然后发布到任意Linux发行版,也可实现虚拟化。容器完全使用了沙箱机制,相互之间不会有任何接口(类似iPhone的app)。几乎没有性能开销,可以很容易地在机器和数据中心中运行。最重要的是,他们不依赖于任何语言、框架或包依赖。
Docker自身使用Go语言开发,并使用了Linux的cgroup、namespacing、支持写时复制特性的AUFS文件系统以及LXC脚本。
OpenIoT是把物联网和云计算相结合的开源解决方案,OpenIoT项目专注于提供一个开源的中间件框架,使得云环境中的物联网IoT应用能实现公式化的自管理。因此,OpenIoT中间件框架将作为物联网应用的宏伟蓝图,使得物联网应用的交付变得自动化,更能适应云基础设施。
OpenIoT创建了一个开源的中间件,可以从传感器云中获取海量信息,而无需顾虑具体使用的传感器是什么。更多开源内容请参考 原文。
7. Sahara顺利毕业,将加速OpenStack与Hadoop的融合
OpenStack Sahara(旧称:Savanna)项目的负责人Sergey Lukjanov昨天正式宣布,Sahara从OpenStack孵化项目顺利毕业,将从OpenStack下一版本Juno开始作为OpenStack核心项目之一。Sahara是在2013年由领先的Apache Hadoop贡献方Hortonworks公司,最大的OpenStack 系统集成商Mirantis公司,以及全球领先的开源解决方案及最新版OpenStack的最大贡献方红帽公司联合发起的,致力于共同在 OpenStack上实现Apache Hadoop,使OpenStack用户能够轻松供应和管理弹性Hadoop集群,加快Hadoop在OpenStack上的开发和部署进程。
Sahara项目的架构图如下:
Apache Hadoop是MapReduce技术的一种实现,目前被各行业广泛采用,已成为大数据处理的行业标准。Sahara项目旨在为OpenStack用户提供一种简单、快捷地部署以及管理Hadoop集群的方案,类似于亚马逊Elastic MapReduce (EMR) 服务。
更多云计算热点新闻: 光网络SDN化的四大驱动力及两条路径、 【走近院士】怀进鹏:全球的计算模式可能重新形成、 高端实战技术培训:OpenStack企业应用之路、 腾讯薛伟:快速模型更新在精准广告推荐中的应用、 【CSDN在线培训QA】小米崔建伟答疑HBase在小米中的应用实践,请继续关注 CSDN云计算频道。(审校/仲浩)
以“ 云计算大数据 推动智慧中国 ”为主题的 第六届中国云计算大会 将于5月20-23日在北京国家会议中心隆重举办。产业观察、技术培训、主题论坛、行业研讨,内容丰富,干货十足。票价优惠,马上 报名 !