2014年05月20日,CSDN携手ChinaHadoop小象社区将打造一场涵盖分布式在线存储系统HBase、数据仓库Hive、Hadoop在电信运营商的应用实践等内容的“Hadoop在企业中的应用实战”高端技术培训。
此次“Hadoop在企业中的应用实战”培训的起因很简单,时下数据已经成为当今企业的核心竞争力,拥有大数据并智慧地使用和运营数据成为企业不可缺少的成功要素。Hadoop生态系统提供了一种实用的、经济有效的、可扩展的架构,帮助企业存储、管理和处理海量数据。业界在Hadoop上的兴趣和投资形成了包括开源软件和商业化软件的整个生态系统,Hadoop迅速成为大数据处理方面的业界事实标准。越来越多的企业急需引入Hadoop技术人才!于是CSDN携手ChinaHadoop小象社区共同打造了此次“Hadoop在企业中的应用实战”!
在本次培训开始前,我和本次培训的讲师刘刚做了一次简单的沟通,他表示将会在5月20日“Hadoop在企业中的应用实战” 分享Hive实战课程,希望通过这次分享,能够让大家掌握使用Hive来分析Hadoop上面的数据。这次讲课以一个Hive的项目开始,来逐一讲解Hive的常用功能和实战经验。报名点击!
刘刚 ChinaHadoop小象社区核心成员
多年Hadoop开发和维护工作,擅长搭建基于Hadoop的海量数据平台和处理TB级数据。 擅长基于MR的算法开发,参与多个Hive、HBase和Mahout的行业应用案例。 《Hadoop应用开发技术详解》作者,《海量数据基于记录级别的容错》专利所有人。
-什么原因吸引你钻研Hadoop技术?
记得四年前跟着PKU的曹老师做项目的时候,曹老师让我去调研大数据技术,那个时候hadoop资料很少,只能去看官方的文档。印象最深的是花了两周搭建了一个节点的hadoop集群。过程虽然困难,当搭建成功的那一刻,所有的困难全部变成了宝贵的经验。
Hadoop自带了分布式存储(HDFS)和分布式计算(MapReduce),随着互联网的快速发展,网络上产生的数据量越来越大,这些数据80%以上是非结构花的,所以存在传统的Oracle或者Mysql里面已经不合适了。这个时候,Hadoop可以完美的解决这个问题。不仅解决了存储问题,同时计算的问题也解决了。
-对于解决哪些问题Hadoop独具优势?
Hadoop在国内使用差不多快6年左右了,目前来看Hadoop在互联网行业使用的比较广泛,主要用于:
1)日志的存储和离线分析。
2)基于Mahout的推荐挖掘。
3)使用Hbase来实现一些半实时的应用。
-目前企业应用Hadoop最大的困难是什么?
在互联网企业Hadoop的使用还是比较好的,但是在传统的行业里面(银行、电信),使用Hadoop还是有困难的。
1)Hadoop的安全性不能满足他们的需求。
2)Hadoop的人才缺少。
3)最重要的是怎么把传统的业务迁移到Hadoop平台上来处理。
-根据您的了解,目前Hadoop发展的情况如何?
Hadoop在未来5-10年还是海量数据存储和计算的首选工具,目前发展的非常迅速,而且正在从互联网行业向传统行业发展。
-请谈谈你在这次Hadoop培训上即将分享的话题。
我将会分享Hive实战课程,希望通过这次分享,能够让大家掌握使用Hive来分析Hadoop上面的数据。这次讲课以一个Hive的项目开始,来逐一讲解Hive的常用功能和实战经验。
-哪些人群应该来参加本次培训?会对他们有哪些帮助?
1)对Hadoop感兴趣的人
2)数据分析师
3)DBA
更多精彩尽在2014年5月20日“Hadoop在企业中的应用实战”培训,目前报名可享受三人成团优惠价!马上报名!
往期采访文章:
董西成:Hadoop将在高速发展和完善中扩大优势!
冼茂源:HBase在垂直搜索业务以及数据存储中的应用!
叶琪:Hadoop不是万能的 要明确场景扬长避短