C++性能分析工具gperftools
最近编写的程序遇到了性能瓶颈,CPU吃满的情况下消费能力上不去,导致消息积压迟迟得不到消费,最终被kafka丢弃
于是开始对程序进行调优,提高消费能力,便找到这个工具,找到程序中使用CPU时间较多的操作,并对这些操作进行调整,反复测试和调整,不断迭代得到高性能的程序
这里只使用了gperftools里的cpuprofiler,谷歌这套工具里面也有堆栈的分析工具,那些下次有用到在做分享吧
编译安装
到github/gperftools上获取源码
wget https://github.com/gperftools/gperftools/archive/gperftools-2.7.tar.gz
tar xvf gperftools-2.7.tar.gz
cd gperftools-2.7
./configure
make -j8
sudo make install
如果是64位系统需要依赖到libunwind
cd libunwind-1.3.1
./configure
make && sudo make install
使用CPUprofiler
在编译的时候连接profiler
gcc [...] -0 proc -lprofiler
使用cmake的情况
target_link_libraries (
...
"profiler"
)
主动结束的程序
在代码中引入gperftools/profiler.h,使用ProfilerStart()和ProfilerStop()函数
#include <gperftools/profiler.h>
int main(int argc, const char* argv[]) {
ProfilerStart("test.prof");
...;
ProfilerStop();
}
在执行ProfilerStop()的时候就生成测试报告test.prof了
持续运行的程序
对于持续运行的程序,例如服务器程序和反复的消费程序,内部是死循环无法主动退出的情况下,可以通过设置开关来控制程序生成测试报告
#include <gperftools/profiler.h>
#include <signal.h>
#include <iostream>
void setGperfStatus(int signum) {
static bool is_open = false;
if (signum != SIGUSR1) {
return ;
}
if (!is_open) { // start
is_open = true;
ProfilerStart("test.prof");
std::cout << "ProfilerStart success" << std::endl;
} else { // stop
is_open = false;
ProfilerStop();
std::cout << "ProfilrerStop success" << std::endl;
}
}
int main(int argc, const char* argv[]) {
signal(SIGUSR1, setGperfStatus);
...;
}
在程序运行后,通过kill指令发送信号控制开启关闭性能分析模块
kill -s SIGUSR1 $PID
开启性能测试后运行一段时间,等待采集到的足够多的样例之后,再次发送信号关闭性能分析,生成测试报告
测试报告
性能分析通过抽样方法完成,默认是1秒100个样本,一个样本是10毫秒,即时间单位是10毫秒
可以通过环境变量CPUPROFILE_FREQUENCY设置采样频率
使用gperftools提供的pprof工具转换.prof文件为可阅读的形式,支持多种形式
文本形式
pprof proc test.prof --text > test.txt
信息
每行包含6列数据,依次为:
- 分析样本数量(不包含其他函数调用)
- 分析样本百分比(不包含其他函数调用)
- 目前为止的分析样本百分比(不包含其他函数调用)
- 分析样本数量(包含其他函数调用)
- 分析样本百分比(包含其他函数调用)
- 函数名
样本数量相当于消耗的CPU时间
整个函数消耗的CPU时间相当于包括函数内部其他函数调用所消耗的CPU时间
树形图
pprof proc test.prof --web > test.html
pprof proc test.prof --pdf > test.pdf
节点
每个节点列出的信息:
- 函数名 或者 类名+函数名
- 不包含内部函数调用的样本数(百分比)
- 包含内部函数调用的样本数(百分比),如果没有内部调用函数则这一项数据不显示
有向边
调用者指向被调用者,有向边上的时间表示被调用者所消耗的CPU时间
过滤
可以通过设置focus或者ignore来集中显示、过滤某个函数
pprof proc test.prof --gv --focus=vsnprintf # 只关注某个函数
pprof proc test.prof --gv --ignore=snprintf # 过滤掉某个函数