国内最全IT社区平台 联系我们 | 收藏本站
华晨云阿里云优惠2
您当前位置:首页 > 互联网 > 盛大游戏IDC部门经理冯祯旺:盛大游戏私有云GCloud实践

盛大游戏IDC部门经理冯祯旺:盛大游戏私有云GCloud实践

来源:程序员人生   发布时间:2014-09-10 05:23:16 阅读次数:2373次

盛大游戏云GCloud是一个全能型的游戏云平台,完全为游戏的需求定制,可以承接所有的游戏产品。高性能成熟稳定,多种资源模型可供选择,有5年、50多款游戏及其他业务的运营支撑的经验。在今年第二届的游戏运营技术论坛上,盛大游戏IDC部门经理冯祯旺与大家分享了盛大游戏私有云GCloud是如何从内部需求慢慢转变到平台产生的过程以及GCloud的特点和优势。冯祯旺拥有14年IT基础架构领域从业经验,在盛大IDC部门工作期间,将部门由只机房现场支持,做成现在独立核算并已内部盈利的云资源提供及运营方。


盛大游戏IDC部门经理冯祯旺

GCloud的诞生过程

冯祯旺表示以前在实际运维过程中经常受到来自业务部门和老板的双重压力,怎样才能既支持好业务部门的业务又能很好地来控制运营成本,是摆在运营部门前面的一个很重要的难题。 随后冯祯旺分享了他们5年来从单机虚拟化到虚拟化集群再到私有云、混合云的艰苦过程。

2008年-2009年,研究探索服务器虚拟化方案,同时进行单机虚拟化的尝试。盛大从2008年开始做云平台,当时也是虚拟化云计算在国内刚刚兴起的时候,在一系列的探索和测试以后开始小规模的试用,2009年将一款有500多台机器的端游传世搬到平台上。第一款产品是VMware的3.5免费版,当把游戏放上去时运维管理机制就出现了问题,运维管理缺少了一些机制、工具,相当于物理机需要手工部署、管理每台机器,过程相当的麻烦。

与此同时,盛大也在研究开源的方式,一方面为了提高运维管理能力,另一方面避免被商业化的产品绑架。从2009年到2010年一直在测试评估KVM的单机虚拟化,在确认适用性后开始迁移新的游戏,但是当玩家人数较高时还是会出现问题,业务部门最关心的是稳定性、可靠性,在经过不断的研究和测试以后终于找到相对稳定的版本。

2010年:新增2款700+服务器的游戏全部迁移到开源虚拟化平台,开始研究集群。随后的一两年中虚拟主机达到了一定规模,把七八百个服务器全部迁移到平台上面来,但还是出现了两个问题:第一预留空间较多,利用率低整合麻烦;第二故障以后恢复时间长。基于这两个原因盛大开始研究集群的方案。最早考虑的是用开源的、分布式的、快存储的方式,但是经过较长的时间运维和开发一起研究后发现像IOPS包括延时很难达到要求,而且也没有足够的人力和技术能力,所以退而求其次用商业化的存储。

在之后2011年后推出这样的方案,前期是用一些轻载的,对性能各方面要求不是特别高的业务在使用。同时单机和集群两个一起来部署,可以根据不同业务的不同需求去利用。

2012年:集群给游戏业务使用,虚拟机比例达25%。到了2012年,在2011年的基础之上推动更多的业务放到新的虚拟化平台上,很多运维管理的问题通过后端的脚本一些工具来去做的。平台也在专门的开发部门安排下根据各方面需求缓慢开发。当平台发展得比较大,虚拟机比例达25%左右的时候,在集群的基础设施方面也做了一些改善,用刀片机加一套商业化的存储,部署变得非常方便。

2013年:虚拟机比例达1/3,研究私有云GCloud。2013年是页游、手游是快速发展的时期,手游也是公司业务重要的战略方向。面对手游、页游上线快、资源弹性需求高的特点,特别是手游,前面两个方案也会遇到一些问题。随后盛大对集群的方案做一些优化:重组集群形成一个池子,存储里面根据不同类型的分为三部分:前端是高性能容量低的机柜,中间是性能、容量适中的,最后是性能较低但容量较高的。这样可以根据业务的变化灵活调整,使整个平台能够有更好的弹性,也可以更快响应业务部门的需求。

同时开发部门在研发平台过程还是存在很多问题,所以决定不再沿用原来的不同模块的开发,而是用全新的开源系统根据内部的需求去做,同时把中间的一些接口和通道打通,包括定制自己的措施和运营管理的界面和平台。几个月的时间后Beta版上线,同时结合以前的资源基本上比较好的能够满足资源弹性要求比较高的这样一些业务的需求。

2014年:虚拟机比例近1/2,将GCloud打造成全能型的混合云。2014年中推出了Gcloud 1.0正式版。Gcloud 1.0同时有三种资源模型,第一种就是前面提到的弹性集群,满足传统的性能和网络要求都不高的业务;第二种是为了满足高IO性能、低延迟、高网络性能需求而推出的高性能定制化的云主机;第三种是满足更多特定要求的物理机。形成一个完整的资源解决方案,GCloud被打造成全能型游戏运营平台。

GCloud的特点和优势

GCloud现在能满足手游、页游、端游等所有游戏的资源需求,成本低于同配置公有云虚拟机,目前在GCloud上面有四十多款的端游和十多款的手游和页游,可用性一直是99.95%+。GCloud有以下几个特点和优势:

模块化可扩展

  • 基础设施:业务定制化的资源配置及网络架构,融合高性能主机、高IO数据库主机和物理机,可满足各种性能和网络、安全上的需求。
  • 管理平台用户资源申请、计费、管理的交互式平台,是用户资源和运维管理的平台系统。
  • 业务接口可根据用户的需求进一步业务定制化,如一键开区/关服/迁移等。

高性能

  • 根据业务的不同需求提供高性能盘、企业级盘和标准盘多种不同规格,用户可灵活选择。
  • 出色的磁盘IO性能,取决于GCloud分层分级存储机制(SSD+SAS),灵活动态的调度策略。
  • 可满足高CPU、高磁盘IO、高网络IO等各种资源需求。

高稳定性

  • 高可靠,支持多个副本,异地存放,大大提高容灾能力。
  • 支持多种备份策略(多块硬盘,在线并行备份,全量/增量备份),可选择定期备份或自定义备份策略。
  • 虚机稳定性保持99.95%以上。

久经考验

5年以上的稳定运营的经验,从产品到运维,到现在已经有50多款端游,还有30多款游戏项目之外的其他的应用,完全从游戏的需求出发定制的。最具游戏支撑经验能够满足所有游戏业务的需求。

高灵活性

  • 弹性的硬件架构分级集群资源,按需采购;结合游戏周期,横向调度;共享的资源池,可伸可缩。
  • 高效的部署运维:快速的虚机生成;批量的部署;自助、交互式平台,申请即可用;可结合项目运维实现更高自动化。
  • 完善实时监控 实时监控虚机的性能和资源利用率。

丰富的资源加优质网络

  • 设备及IDC资源:

    公司所有游戏和其他业务的需求,共享统一的资源池

    几千台常备服务器、几百个可用机柜作为后备资源池,且根据具体需求每季度补充。
  • IDC网络覆盖:选择运营商网络等级最高的机房;所有机房n*10G的上联,配备攻击防护设备;多维度网络监测/监控。
生活不易,码农辛苦
如果您觉得本网站对您的学习有所帮助,可以手机扫描二维码进行捐赠
程序员人生
------分隔线----------------------------
分享到:
------分隔线----------------------------
关闭
程序员人生