0001-01-01 2558 words 6 minutes

Contents

性能监测工具

本文采用知识共享署名 4.0 国际许可协议进行许可，转载时请注明原文链接，图片在使用时请保留全部内容，可适当缩放并在引用处附上图片所在的文章链接。

nmon
TOP
perf
- 火焰图
Valgrind

nmon

简介

nmon是一种在AIX与各种Linux操作系统上广泛使用的监控与分析工具，它能在系统运行过程中实时地捕捉系统资源的使用情况，记录的信息比较全面，并且能输出结果到文件中，然后通过nmon_analyzer工具产生数据文件与图形化结果。

nmon可监控的数据类型

内存使用情况

磁盘适配器

文件系统中的可用空间

CPU使用率

页面空间和页面速度

异步I/O，仅适用于AIX

网络文件系统（NFS）

磁盘I/O速度和读写比率

服务器详细信息和资源

内核统计信息

消耗资源最多的进程

运行队列信息

特点

①、占用系统资源少（一般不到2%）

②、功能强大（监控数据类型全面）

③、结合grafana之类的仪表图，可以更直观的实时展示所监控的数据

④、移植性、兼容性较好

采集数据

./nmon -ft -s 10 -c 60 -m /root/nmon 
# 参数说明 
-f   监控结果以文件形式输出，默认机器名+日期.nmon格式 
-F   指定输出的文件名，比如test.nmon 
-s   指的是采样的频率，单位为毫秒 
-c   指的是采样的次数，即以上面的采样频率采集多少次 
-m   指定生成的文件目录

**PS：**一般来说不建议对稳定性测试使用nmon监控，因为生成的nmon文件超过10M时，分析工具会由于内存不足导致报错。

如果必须进行的话，建议加大采样频次，降低采样次数（低于330次）

TOP

CPU核数和load average的关系

平均负载是指上一分钟同时处于就绪状态的平均进程数。在CPU中可以理解为CPU可以并行处理的任务数量，就是CPU个数X核数。如果CPU Load等于CPU个数乘以核数，那么就说CPU正好满负载，再多一点，可能就要出问题了，有些任务不能被及时分配处理器，那要保证性能的话，最好要小于CPU个数X核数X0.7。

Load Average是指CPU的Load。它所包含的信息是在一段时间内CPU正在处理及等待CPU处理的进程数之和的统计信息，也就是CPU使用队列的长度的统计信息。

Load Average的值应该小于CPU个数X核数X0.7，Load Average会有3个状态平均值，分别是1分钟、5分钟和15分钟平均Load。如果1分钟平均出现大于CPU个数X核数的情况，还不需要担心；如果5分钟的平均也是这样，那就要警惕了；15分钟的平均也是这样，就要分析哪里出现问题，防范未然。

Linux查看物理CPU个数、核数、逻辑CPU个数

CPU总核数 = 物理CPU个数 * 每颗物理CPU的核数总逻辑CPU数 = 物理CPU个数 * 每颗物理CPU的核数 * 超线程数

`1`	`more /proc/cpuinfo`

RK3399

processor	: 0
BogoMIPS	: 48.00
Features	: fp asimd evtstrm aes pmull sha1 sha2 crc32
CPU implementer	: 0x41
CPU architecture: 8
CPU variant	: 0x0
CPU part	: 0xd03
CPU revision	: 4

processor	: 1
BogoMIPS	: 48.00
Features	: fp asimd evtstrm aes pmull sha1 sha2 crc32
CPU implementer	: 0x41
CPU architecture: 8
CPU variant	: 0x0
CPU part	: 0xd03
CPU revision	: 4

processor	: 2
BogoMIPS	: 48.00
Features	: fp asimd evtstrm aes pmull sha1 sha2 crc32
CPU implementer	: 0x41
CPU architecture: 8
CPU variant	: 0x0
CPU part	: 0xd03
CPU revision	: 4

processor	: 3
BogoMIPS	: 48.00
Features	: fp asimd evtstrm aes pmull sha1 sha2 crc32
CPU implementer	: 0x41
CPU architecture: 8
CPU variant	: 0x0
CPU part	: 0xd03
CPU revision	: 4

processor	: 4
BogoMIPS	: 48.00
Features	: fp asimd evtstrm aes pmull sha1 sha2 crc32
CPU implementer	: 0x41
CPU architecture: 8
CPU variant	: 0x0
CPU part	: 0xd08
CPU revision	: 2

processor	: 5
BogoMIPS	: 48.00
Features	: fp asimd evtstrm aes pmull sha1 sha2 crc32
CPU implementer	: 0x41
CPU architecture: 8
CPU variant	: 0x0
CPU part	: 0xd08
CPU revision	: 2

Serial		: d1462410d789df12

双Cortex-A72大核+四Cortex-A53小核结构 = 6

6 * 0.7 = 4.2

perf

火焰图

火焰图整个图形看起来就像一团跳动的火焰, 这也正是其名字的由来. 燃烧在火苗尖部的就是 CPU 正在执行的操作, 不过需要说明的是颜色是随机的, 本身并没有特殊的含义, 纵向表示调用栈的深度, 横向表示消耗的时间。因为调用栈在横向会按照字母排序, 并且同样的调用栈会做合并, 所以一个格子的宽度越大越说明其可能是瓶颈。综上所述, 主要就是看那些比较宽大的火苗, 特别留意那些类似平顶山的火苗。

Valgrind

valgrind通常用来成分析程序性能及程序中的内存泄露错误。

Valgrind工具包包含多个工具，如Memcheck,Cachegrind,Helgrind, Callgrind，Massif。

安装

`1`	`sudo apt-get install valgrind`

工具说明

Memcheck 工具主要检查下面的程序错误：

　　1.使用未初始化的内存 (Use of uninitialised memory) 　　2.使用已经释放了的内存 (Reading/writing memory after it has been free’d) 　　3.使用超过 malloc分配的内存空间(Reading/writing off the end of malloc’d blocks) 　　4.对堆栈的非法访问 (Reading/writing inappropriate areas on the stack) 　　5.申请的空间是否有释放 (Memory leaks – where pointers to malloc’d blocks are lost forever) 　　6.malloc/free/new/delete申请和释放内存的匹配(Mismatched use of malloc/new/new [] vs free/delete/delete []) 　　7.src和dst的重叠(Overlapping src and dst pointers in memcpy() and related functions) Callgrind 　　Callgrind收集程序运行时的一些数据，函数调用关系等信息，还可以有选择地进行cache 模拟。在运行结束时，它会把分析数据写入一个文件。callgrind_annotate可以把这个文件的内容转化成可读的形式。

Cachegrind 它模拟 CPU中的一级缓存I1,D1和L2二级缓存，能够精确地指出程序中 cache的丢失和命中。如果需要，它还能够为我们提供cache丢失次数，内存引用次数，以及每行代码，每个函数，每个模块，整个程序产生的指令数。这对优化程序有很大的帮助。

Helgrind 　　它主要用来检查多线程程序中出现的竞争问题。Helgrind 寻找内存中被多个线程访问，而又没有一贯加锁的区域，这些区域往往是线程之间失去同步的地方，而且会导致难以发掘的错误。Helgrind实现了名为” Eraser” 的竞争检测算法，并做了进一步改进，减少了报告错误的次数。

Massif 　　堆栈分析器，它能测量程序在堆栈中使用了多少内存，告诉我们堆块，堆管理块和栈的大小。Massif能帮助我们减少内存的使用，在带有虚拟内存的现代系统中，它还能够加速我们程序的运行，减少程序停留在交换区中的几率。

使用

# 1.检查内存泄漏
valgrind --tool=memcheck --leak-check=yes ./Test

# 2.收集程序运行数据
valgrind --tool=callgrind ./helTest

# 3. cach 分析
valgrind --tool=cachegrind ./helTest

# 4.检查多线程竞争问题
valgrind --tool=helgrind ./helTest

# 5.堆栈分析
valgrind --tool=massif ./helTest

libra 应用

`1`	`valgrind --tool=memcheck --leak-check=yes --log-file=libra.log ./libra --basedir=/home/deepglint/AppData/libraT`