云计算和大数据的产业顶级盛会,“ 第六届中国云计算大会 ”将于2014年5月20-23日在北京国家会议中心隆重召开。
本届大会的主题是“ 云计算大数据 推动智慧中国 ”,以国际化视野,把握全球云计算发展趋势;通过培训课程、专题论坛和项目评选等方式,深度剖析云计算与大数据的核心技术;从应用出发,探讨云计算和大数据在交通、制造、医疗、教育、金融、数字娱乐等领域实践经验。大会历时四天,涵盖“突出行业应用、分享技术趋势、促进国际合作、打造共赢平台”四大特性,内容更加精益求精,预计参会者将大大超过上一届的12000多人次。
第六届中国云计算大会 已邀Yttibrium公司创始人Per Brashers(曾总管Facebook整个存储部门)为演讲嘉宾。
Per Brashers,现Yttibrium公司创始人。2012年1月至2013年8月,Per任Data Direct Networks公司存储解决方案部门的总技术架构师。2011年5月至2012年11月,Per总管Facebook的整个存储部门。
Per 曾在EMC任职11年。2010年6月至2011年5月,Per担任EMC公司备份和数据恢复领域的高级技术专家,为客户的复杂难题设计了解决方案。2006年11月-2010年6月,Per作为EMC NAS工程设计部门的总监,率领MPFS开发团队实现了1亿美元的营收。2000年1月-2006年11月,Per 担任EMC公司美国西部面向客户的技术商务顾问。
Per是一位极具远见的存储战略家。他发明创造了若干对业界具有深远影响的存储平台,其中包括用于Facebook引领的Open Compute
Project系统下的OpenVault及Cold Storage解决方案。他设计了多个适用于数据中心中的互联系统。Per还是pNFS-Block的作者,也是现今最快的Hadoop存储阵列系统的架构师。Per还将传统的3X复制策略转化为纠删码(erasure
code)的存储方案,从而最大化使用效率。
Per的名下共拥有21项(含待发)专利发明,多数在存储领域,擅长解决存储及存储网络连接、数据块、文件及对象存储等方面的问题,并擅长于利用纠删码来实现数据分布,弹性调度及提升效率。Per在删除重复存储以降低存储成本方面也是专家。他善于将用户的需要转化为切实可行的执行方案,专长于在Hadoop及BigData应用领域的性能改善。他身兼数任,工作在NAS、SAN、IP网络连接、备份及恢复方案、应用性能分析等多个领域,并兼负标准起草/编辑、难题专家、发明人等多重身份。
Per的兴趣与关注点还不仅限于此,他竭力为了改善人们的居住环境献计献策,如为住家提供空气效能方面的的相关发明作出了不懈努力。Per的业余爱好之一是有机种植,同时也是一位家庭啤酒酿造师,曾获得UC
Davis 酿酒科学的荣誉硕士学位。同时,Per 还在不断学习改进其葡萄酒酿造技艺!
Per有着丰富的存储系统设计经验,对软硬件结合有着清晰的思路,下面是Per在2013年9月XLDB(第七届超大型数据库大会)上发表的看法,虽然有些趋势可能已经被实现,但是其中存在的价值仍不可忽视。
Per从存储、控制器(或网络)、内存、CPU、数据中心环境五个点着手,分享了硬件领域的变革趋势,并分析了这些变革对应用程序的影响:
一、 存储
1. 存储的趋势:SATA-4被IETF否决、混合类型磁盘将大有可为、对象存储正在侵蚀整个世界、SSD在短期之内仍然得不到完全利用、云存储将减少机构的内部磁盘采购、移动计算将完全建立在SSD上、专为大数据设计的新类型磁盘将诞生、机构将被新类型的磁盘密度问题困扰。
2. 磁盘耗电将影响到采用。相信不久后,2.5英寸磁盘就会被广泛的用于大数据场景,除下有人能找到优化3.5英寸磁盘的电能消耗方法。
3. 磁盘性能增加遥遥无期。在过去,磁盘访问速度增长相当可观,但是在2000年后,整整13年都毫无提升。
4. 基于历史的推测。在过去,容量增长呈线性增加,但是当下基本上已到一个瓶颈。
5. 磁盘密度未来堪忧。随着密度增加放缓,游戏规则已经被改变:首先,当下的探索已转变为数据的寿命,同时减少运维已经成为大家追逐的目标;其次,在之前,磁盘技术迭代时间是3年,然而当下已转变为5年,磁盘使用寿命也必须随之增加,毫无疑问,这将对RMA值和销售增量产生影响;最后,新的控制器需要针对现有数据集的数据存放空间及启动性能设计。
在数据爆发的当下,如此堪忧的前景将会对应用程序设计产生众多影响,这里主要从发展情况和数据持久上看:
1. 发展情况
2. 数据持久
控制器及网络发展趋势:性能更强,体积更小;12GBb可能是最终状态;SAS和PCiE将是这个领域的角逐者;PHY add-ins将需求更复杂的配置;芯片销售将被拆分;DMA/RDMA已经成熟落地;设备级的合作将增加,机构的目标将放到RAID拆分上;T10-diff及其他校验/安全特性;传统的RAID仍然是主要收入来源;网络将会有巨大的改变,比如SAS/PCiE/Silicon Photonics及OpenFlow/“Agnostic Networks”。
基于控制器/网络的改变又会给应用程序带来什么样的影响?这里同样从发展情况和数据持久两方面来看:
飞速发展
数据持久
PS:内存、CPU、数据中心环境发展对软件产生的影响请见下一页
1. 这是一个变革的时代:许多玩家都在引进新的、密集的、更慢的DRAM替代方案;所有人都在期待内存的可持久化。
2. 3D NAND的实现:Toshiba的演示、其他供应商准备在2014年发布产品及以移除DRAM为目标(更密集的“dimm”及主机内存的持久化)。
那么,内存的改变对应用程序设计又意味着什么,下面从发展和数据持久两个方面解读:
发展趋势
数据持久
四、 CPU
CPU趋势:频率上的文章已经消失;多核和offload的关注继续增加;库和其他编译时辅助变得普及;移动市场驱动的低功率组建提供了许多有趣的拆分选择,按需组装和释放网络组件,软件定义计算机的时代来临。
对应用的影响。发展方面:越来越多的in-card运算,性能增加带来的极端密度,新的库需要验证应用性。数据持久方面:更多的线程、更多的核心,更多的碎片,需要注意门槛;拆分意味着更多的错误检查,offload可能有所帮助,但是你可能还是期望对方法进行更严格的校验。
五、 数据中心
数据中心环境主要涉及3个部分,数据中心设计、电力分布及机架/服务器/存储。据统计,21%公司都运营了一个智能数据中心,数据中心在新项目的投资超过50%。随着数据中心占整个IT界计算比重的增加,更多的二氧化碳(电能供应)、热量、污水等被排出。同时,鉴于高热等因素,更多的铜、银等材料被腐蚀,而存储介质故障率增加更是亟待解决的问题之一。如此情况下,应用成熟又会受到什么样的影响?
首先,发展
其次,数据持久
应用程序将承担更多的可用性职责,数据中心故障不可避免。DCiM有助于转移负载,从而避免宕机。