国内最全IT社区平台 联系我们 | 收藏本站
华晨云阿里云优惠2
您当前位置:首页 > 互联网 > 百度资深研发工程师周晓波:平台+数据 百度培养安全人才的重要思路

百度资深研发工程师周晓波:平台+数据 百度培养安全人才的重要思路

来源:程序员人生   发布时间:2014-09-09 22:45:29 阅读次数:3797次

5月24日,首届中国网络安全提速论坛在中关村软件园召开。本次论坛主题为“如何建立安全人才快速培养机制?”,来自百度、CSDN、卡饭论坛、IDF威慑防御实验室等多位专家围绕该议题展开深入探讨。


百度资深研发工程师周晓波

百度资深研发工程师周晓波从百度安全产品角度分享了安全人才需求与培养机制。他表示互联网时代的安全体系较传统思路有很大区别,它更强调大量用户的参与、分享,更重视云能力,更加注重病毒源头的查杀,最关键是加入了运营回路流程。

这一安全体系对应的人才需求是怎样的呢?首先在构建高性能的云服务时,需要高性能服务开发和运营团队;而在构建文件鉴定与分析系统时,则需要安全研发与运营团队及分布式平台建设与维护团队;最后是构建样本库,此时需要非常强大的样本收集与分类团队。具体到更直接的安全人才,在构建网页鉴定与分类系统时,则需要网页安全的研发团队及网页样本分析团队;在样本运营流程中,则需要样本分析团队;将样本分析结果反馈到安全能力上,则需要数据挖掘团队与引擎研发团队。

鉴于以上人才架构,周晓波表示,百度在安全人才培养上采用了平台加数据的思路。在以海量数据为“营养食品”;以大数据分布式平台、大规模用户量为“训练器材”;参与运营流程为“培训课程”的培养机制下,百度所培养将是一种互联网化的泛安全的人才。他们可以在互联网大背景下,从用户使用角度来考虑问题,适应互联网节奏,是优秀的互联网人才,而非片面的安全人才。

以下为演讲实录:

周晓波:我从我们百度安全产品角度讲讲人才需求和培养的机制。

首先是安全体系。我们这个百度杀毒、百度卫士产品的角度。

互联网时代体系下的安全人才需求

思路是什么呢,首先是互联网的视角,互联网的视角与传统安全的思路有什么区别?它更重视用户,要大量的用户参与、分享。第二个,比传统的厂商相比,更强调云能力,云能力在安全的角度来看,其实就是一种结果化的体现,就是说一个病毒在一个用户当中出现了之后,我们对他的鉴定结果在云端结果已经存在了,后续的用户就能够直接拿着这个结果来指导这个东西是否是病毒。第三个,我们更强调病毒的源头,我们从源头上去卡住。所以我们的安全能力有两大部分,第一部分所谓的文件安全,另一个大的块,就是UL的安全。尤其是在现在这个阶段,用户电脑上的威胁更多的来自于木马而不是蠕虫类,用户主动的行为是造成威胁最重要的来源,我们从UL源头上卡住是一个非常好的思路。第三点,平台加数据。这也是我们对人才培养的一个重要的思路,我们有大量的用户平台,比如说千万量的用户数,另外我们有大规模的分布式计算平台,我们有大量的数据,样本数据,在这个基础之上我们来构建我们的安全能力。

具体执行上什么样子呢?这就是从架构层面来看,我们对于用户机器上可疑的一些文件的识别,是这样一个流程。首先是,我们会通过云服务预先可能有98%、99%以上的那些样本已经知道他的安全与否了,这是第一次过滤,这一次过滤又包含两部分,一部分,对于这个样本的摘要,他的签名、摘要。另外一部分,就是他的特征,我们可以从更广泛的特征去描述这个病毒,在云端把他识别出来。这一步之后我们会漏掉2%、1%左右的样本,这个时候就会用本地的引擎调度,大家知道百度云,卡巴星是其中的一部分,这是比较复杂的调度的策略。这一步之后,又会检出大概百分之八九十以上,但这样还会有一些漏掉的,我们就以基于数据分类、数据挖掘这样的进行分类,对于漏掉的样本对他进行黑和白的一刀切。

这是整个的流程,这三步我们认为叫做静态能力的体现,最关键的是第四步,是运营回类,我们分类之后的那些样本肯定会存在误报和漏报的,这个时候就需要从大量的数据统计层面去告诉安全相关的人才介入进来了,去告诉他哪些样本需要你们来进行分析告诉我们结果是什么,然后把这些结果再反馈到云服务以及那些引擎的更新上面去。当然还有一些辅助的能力,包括自保护、修复,这些这里就不讲了。这是从整体的安全能力的运作流程上来讲是这个样子的。

与刚才的安全体系对应的人才的需求是什么样子呢?左边,首先是我们要构建高性能的云服务,这是有一个叫做高性能服务开发和运营的这样一个团队来实施的,他每天会响应几百亿的客户端的请求,我们需要非常快速的反馈到客户端。比如说在主动防御这样的场景下,用户对于这种延时是要求非常高的,对于高性能服务开发的要求非常非常高。而从另一方面来讲,对于可靠性,所谓的运营方面的能力要求很高,比如说在网络出现故障的时候或者核心网络出现故障的时候,我们怎么保证用户不出现误报,这是这方面的人才。

另一方面,构建文件鉴定分析的系统。这是两个团队来做的,一个是安全研发团队一个是运营团队,他们大量的是云端鉴定器的开发与实施,在大规模的分布式的平台上搞起来,因为这个必然是分布式的去搞,因为数百亿的请求过来单机不可能撑得住的。另外就是,分布式平台的建设与维护。前面研发成果要能够跑起来是依附于分布式平台的。

第三块,构建样本库。这个是以互联网的这种思维去建立安全产品非常重要的策略,不仅仅是从样本库中去找有问题的文件,而是说我们把市面上所有的文件都能够知道马上给他打上标签黑还是白,所以这个就需要一个非常强的样本收集与分类的团队。

右侧可能是大家更关注的,更直接的安全相关的人才。一个是构建网页的鉴定与分类系统,我刚才讲到了,我们一个非常重要的思路就是说,从源头去保证安全,用户访问网页以及下载网上的一些文件,这个其实是最大的一个威胁。这里有两个团队,网页安全的研发团队,也就是研发鉴定网页安全鉴定器的团队,以及样本分析的一个团队。

第二个是样本运营的流程,实施的团队。这个跟尤其是卡饭这里的这些同事们会更密切的结合一些,就是说我们发现有问题需要给出报告,他哪里有问题,是不是有问题。

分析之后的结果反馈到安全能力上是怎么来搞的,有两个团队会来执行这个事情,第一个是数据挖掘的团队,这个是现在慢慢流行起来的,就是说我不从安全本身去对于样本进行分类,而我仅仅把它当成一个二进计算,我知道一批用户和一批样本是黑的,我知道一批拥护和一批样本是白的,我进行是进行模式分类,这个比较像自然免处理的思维。另外,引擎的研发。样本输出的结果会告诉那个引擎研发的团队,你需要有这样的方式来把他识别出来,这个团队就会开发出这样的鉴定器,可能放到客户端做本地的引擎,可能放到云端作为他的引擎。这个就是与前边整体的流程配合的一个团队的设置大概是这个样子。

平台+数据 百度培养安全人才的重要思路

最后来点题,平台加数据是安全人才的摇篮,这是我们对于安全人才培养的一个思路。

首先,这里的安全人才主要在分析、引擎和数据这三块。左侧的这个团队,我们把他认为是安全支撑团队,不是直接与安全本身有关系的,但是他会为安全的人才提供一个好的平台。

特点是互联网的思维。我们培养的人才是一种互联网化的泛安全的人才,他要放在互联网这个大背景下,从用户使用的角度来考虑问题,他要适应互联网的节奏,我们希望让他们成长为优秀的互联网的人才,而不仅仅是很片面的安全人才。

另外,为时间是摇篮呢?刚刚提到的那三点。第一个是,海量的数据,因为对于安全人才来说,他需要大量的样本,需要大量的经典的数据分析,海量的数据对他们来说是非常好的视频。另外,他们需要训练的场地和信息,我们先从样本库里掏出一些样本看看结果怎么样,我们调参数,这个时候没有大规模的分布式的平台是没有办法实施的,另外,大规模的用户量,你的安全的输出究竟有没有效果,我们要实战去演练一下,我们也几千万的用户量,我们可以通过一定的方式验证一下效果怎么样,效果好的我们继续往下推。

第三点,所谓的培训,参与到运营流程中间去,前面我讲的那个流程中间的第四环,就是运营回路,那个是非常重要的,这个回路的驱动全靠安全人才来驱动的,其他的辅助的团队是为了构建这个系统的。

最后,我们对于人才培养的愿景是什么,反复强调的是互联网思维,我们培养的是互联网安全的人才,而不是片面的人才。另外,也希望是为全社会培养人才,而不是味我们公司。前面刘江老师也提到过的,现在安全,尤其是网络安全已经是切入到每个人日常生活当中了,安全已经不仅仅是一个安全厂商的问题了,我们希望通过我们这样一个平台能够培养出大量的安全人才,他们作为一个安全的布道师能够提高整个全社会对于安全的认识。

生活不易,码农辛苦
如果您觉得本网站对您的学习有所帮助,可以手机扫描二维码进行捐赠
程序员人生
------分隔线----------------------------
分享到:
------分隔线----------------------------
关闭
程序员人生