Visual studio 2010 的Profiler是自带的性能工具, 利用它我们可以找出程序中的性能瓶颈,然后不断优化不断再测试。
Profiler有益用向导启动程序和后期附加到程序两种关联被测模块的方式,测试方式也有两种:Sampling(采样)和Instrumentation(检测)。
Sampling:按设置的时间间隔中断计算机处理器并搜集函数调用堆栈。
调用堆栈是1个动态结构,用于存储有关正在处理器上履行的函数的信息。这个分析方法构成的结果就是各个函数在运行时被采样的次数,次数越大代表开消越大。由于对被测源码不需要更改,所以直接启动或后期附加到被测程序都可以。
Instrumentation:在被测源码文件中目标函数的开始和结尾和这些函数对其他函数的每次调用前后插入代码。
插入的代码记录了以下信息:
根据”ToolsOptionsPerformance Tools“ 下‘Show time values as:’的默许设置为Milliseconds,我觉得采样周期应当是毫秒级,也就是说报告中采样次数可以约等于毫秒。
通过‘AnalyzeLaunch Performance Wizard…’ 或‘AnalyzeProfilerAttach or Detach…’对被测程序进行新建Performance Session(性能会话), 我们主要介绍下Sampling通过Attach To Process的情况下报告的分析。
Profiler开始后,类似:
当你觉得已搜集了足够的信息可以停止后, 点击‘Stop profiling’, 类似:
上述界面就是报告的Summary, 我们开始分析程序的性能瓶颈。
‘Hot Path’指的就是采样次数高的,也就是性能瓶颈的函数。
‘Inclusive Samples’指的是该函数整体被采样的次数,说白了,就是函数本身和它所调用的所有子函数的总共开消大小。
‘Exclusive Samples’指的是该函数本身被采样的次数,说白了,也就是函数自己的开消大小,不包括它所调用的子函数的开始。
通过上述几个介绍,我们就能够从图中得到性能瓶颈的函数, 然后根据Call Tree可以得到完全的调用上下文。
例如,在Summary界面中点击CallTree,依照‘Inclusive Samples’排序,依照开消大小展开方法,终究就能够得到开消大的函数上下文, 类似:
固然,我们也能够通过上面的过滤条件选择”Modules“、”Threads“等方式来找到自己关心的瓶颈。
另外, 我们还可以在Summary界面选择‘Show Just My Code’和适当的CPU时间段来过滤。
参考:Analyzing Application Performance by Using Profiling Tools