背景

近期,在12服务器上测试时发现,多线程工具开满核后,cpu只能占到50%,占不上去。故今天花了一天的时间,专门解决cpu占不上去的问题。

说明:查看系统CPU负载及使用率的命令为:top    vmstat

  • top 命令:查看进程级别的cpu使用情况。
  • vmstat 命令:查看系统级别的cpu使用情况。

说明:

  • r: 表示系统中 CPU 等待处理的线程。由于 CPU 每次只能处理一个线程,所以,该数值越大,通常表示系统运行越慢。
  • us:用户模式消耗的 CPU 时间百分比。该值较高时,说明用户进程消耗的 CPU 时间比较多,比如,如果该值长期超过 50%,则需要对程序算法或代码等进行优化。
  • sy:内核模式消耗的 CPU 时间百分比。
  • wa:IO 等待消耗的 CPU 时间百分比。该值较高时,说明 IO 等待比较严重,这可能磁盘大量作随机访问造成的,也可能是磁盘性能出现了瓶颈。
  • id:处于空闲状态的 CPU 时间百分比。如果该值持续为 0,同时 sy 是 us 的两倍,则通常说明系统则面临着 CPU 资源的短缺。

过程

IO占用

首先,我猜想是不是因为IO占用太多,导致cpu占不上去,于是去查了一下IO占用:

说明:iostat

从系统开机到当前执行时刻的统计信息

  • Avg-cpu:总体cpu使用情况统计。
  • Iowait:cpu用于等待io请求的完成时间。
  • Device:各磁盘设备的IO统计信息。各列含义如下:
  • Device: 以sdX形式显示的设备名称
  • tps: 每秒进程下发的IO读、写请求数量
  • KB_read/s: 每秒从驱动器读入的数据量,单位为K。
  • KB_wrtn/s: 每秒从驱动器写入的数据量,单位为K。
  • KB_read: 读入数据总量,单位为K。
  • KB_wrtn: 写入数据总量,单位为K。

说明:iostat –x –k –d 1 2

每隔1S输出磁盘IO的详细详细,总共采样2次。

  • -x:输出更详细的io设备统计信息
  • -k/-m:输出结果以kB/mB为单位
  • -d:单独输出device结果,不包括cpu结果
  • Interval/count:每次输出间隔时间,count表示输出次数,不带count表示循环输出
  • 更多选项,可以使用man iostat查看

各列含义如下:

  • rrqm/s: 每秒对该设备的读请求被合并次数,文件系统会对读取同块(block)的请求进行合并
  • wrqm/s: 每秒对该设备的写请求被合并次数
  • r/s: 每秒完成的读次数
  • w/s: 每秒完成的写次数
  • rkB/s: 每秒读数据量(kB为单位)
  • wkB/s: 每秒写数据量(kB为单位)
  • avgrq-sz:平均每次IO操作的数据量(扇区数为单位)
  • avgqu-sz: 平均等待处理的IO请求队列长度
  • await: 平均每次IO请求等待时间(包括等待时间和处理时间,毫秒为单位)
  • svctm: 平均每次IO请求的处理时间(毫秒为单位)
  • %util: 采用周期内用于IO操作的时间比率,即IO队列非空的时间比率

重点关注参数:

1、iowait% 表示CPU等待IO时间占整个CPU周期的百分比,如果iowait值超过50%,或者明显大于%system、%user以及%idle,表示IO可能存在问题。

2、avgqu-sz 表示磁盘IO队列长度,即IO等待个数。

3、await 表示每次IO请求等待时间,包括等待时间和处理时间

4、svctm 表示每次IO请求处理的时间

5、%util 表示磁盘忙碌情况,一般该值超过80%表示该磁盘可能处于繁忙状态。

结果发现IO占用正常,于是排除了IO的问题。

内存占用

其次,想到是否因为内存占不上去,导致实际执行线程数小于设定的线程数,于是导致了cpu占不上去。

此时,我换了一台可以正常跑的机器,开同样的线程数,观察了一下内存占用。发现两者内存占用一致。

于是,排除了内存占用的问题。

僵尸进程

再想,有没有可能是因为僵尸进程导致了cpu占不上去呢?于是top一下:

发现没有僵尸进程。

CPU主动降频

最后,有同事提示,是否因为cpu主动降频了,所以导致cpu占不上去。于是专门百度了一下CPU降频的相关知识。

调节器governor可用来控制CPU频率,可选如下:

内核模块

调节器名称

功能

cpufreq_ondemand

ondemand

按需调节,内核提供的功能,不是很强大,但有效实现了动态频率调节

cpufreq_powersave

powersave

省电模式,通常以最低频率运行,

cpufreq_userspace

userspace

用户模式,一些调频工具软件需要在此模式下才能运行

cpufreq_conservative

conservative

“保守”模式,类似于ondemand,但调整相对较缓

N/A

performance

不降频

查看当前的调节器:
cat /sys/devices/system/cpu/cpu0/cpufreq/scaling_governor

发现当前使用的是powersave,省电模式,确实会自动降频。于是修改当前模式为performance:

echo performance > /sys/devices/system/cpu/cpu0/cpufreq/scaling_governor

此时去跑多线程程序,发现cpu可以占上去了。

至此,问题解决。

总结

此次cpu占不上去,排查到最后,发现是因为降频导致的。以后可以先通过如下命令查看当前使用的是哪种调节器:

cat /sys/devices/system/cpu/cpu0/cpufreq/scaling_governor

确认是否使用了降频模式,然后再去排查其他可能情况。

补充说明:

performance  : CPU 会固定工作在其支持的最高运行频率上;

powersave  : CPU 会固定工作在其支持的最低运行频率上。因此这两种 governors  都属于静态  governor  ,即在使用它们时  CPU  的运行频率不会根据系统运行时负载的变化动态作出调整。这两种 governors  对应的是两种极端的应用场景,使用  performancegovernor  体现的是对系统高性能的最大追求,而使用  powersave governor  则是对系统低功耗的最大追求。

Userspace :最早的  cpufreq  子系统通过  userspace governor 为用户提供了这种灵活性。系统将变频策略的决策权交给了用户态应用程序,并提供了相应的接口供用户态应用程序调节CPU 运行频率使用。(可以使用 Dominik  等人开发了 cpufrequtils  工具包   )

ondemand  : userspace 是内核态的检测,效率低。而 ondemand 正是人们长期以来希望看到的一个完全在内核态下工作并且能够以更加细粒度的时间间隔对系统负载情况进行采样分析的  governor 。

conservative  :  ondemand governor  的最初实现是在可选的频率范围内调低至下一个可用频率。这种降频策略的主导思想是尽量减小对系统性能的负面影响,从而不会使得系统性能在短时间内迅速降低以影响用户体验。但是在  ondemand governor  的这种最初实现版本在社区发布后,大量用户的使用结果表明这种担心实际上是多余的,  ondemand governor 在降频时对于目标频率的选择完全可以更加激进。因此最新的 ondemand governor  在降频时会在所有可选频率中一次性选择出可以保证 CPU  工作在  80%  以上负荷的频率,当然如果没有任何一个可选频率满足要求的话则会选择CPU  支持的最低运行频率。大量用户的测试结果表明这种新的算法可以在不影响系统性能的前提下做到更高效的节能。在算法改进后,  ondemand governor  的名字并没有改变,而  ondemandgovernor  最初的实现也保存了下来,并且由于其算法的保守性而得名  conservative  。

参考链接

IO占用:https://www.cnblogs.com/ultranms/p/9327784.html

查看进程占用cpu、内存、io信息:http://blog.51cto.com/liuqun/2049656

查看CPU负载及使用率:http://www.cnblogs.com/brightbrother/p/8124915.html

Cpu频率调节:http://blog.sina.com.cn/s/blog_62218fc80100rko7.html

不同频率控制方式说明:https://blog.csdn.net/lizhiqiang50/article/details/50992847

cpu占不上去问题总结相关推荐

  1. IDEA的CPU占用率高问题解决方法

    前言:这段时间发现 IDEA 的 CPU 占用率猛涨,时不时就飙升到百分之7.80,使得敲代码的体验感十分不佳,在经过一番查找之后终于解决了问题,在此记录一下 IDEA的CPU占用率高问题解决方法 问 ...

  2. Linux 下杀毒软件 CPU 占用率为何持续升高?

    作者 | beyondma  责编 | 张文 来源 | CSDN 博客 头图 | CSDN 下载自视觉中国 最近笔者遇到这样一个相对比较疑难的事件,某个在 Linux 下运行的杀毒软件启动后,在某些情 ...

  3. CPU占用率高的九种可能~

    首先是考虑病毒~ 其次: 1.防杀毒软件造成故障 由于新版的KV.金山.瑞星都加入了对网页.插件.邮件的随机监控,无疑增大了系统负担.处理方式:基本上没有合理的处理方式,尽量使用最少的监控服务吧,或者 ...

  4. 如何定位cpu占用率高的java线程

    如何定位cpu占用率高的java线程 工具: 1 jstack:jstack用于打印出给定的java进程ID或core file或远程调试服务的Java堆栈信息,如果是在64位机器上,需要指定选项&q ...

  5. linux mysql cpu 查看工具_Shell编程检测监控MySQL的CPU占用率

    shell编程很强大!网站访问量大的时候MySQL的压力就比较大,当mysql的CPU利用率超过300%的时候就不能提供服务了,近乎卡死状态,这时候最好的方法就是重启mysql服务.由于这种事具有不可 ...

  6. win10句柄数比win7多 cpu占用率 高_Win10更新再出问题!CPU使用率高+损坏SSD,修复方法来了...

    Win10的系统更新,真的是跟拆盲盒一样时刻面临着"惊喜". 毕竟,win10系统的更新出错,都不是一天两天的事情了,完全让人吃不消. 上次win10 2004号称最稳定的版本,乐 ...

  7. win10运行在哪里_升级!Win10 2004版即将推送,减少CPU占用率,旧电脑也运行如飞...

    现在,一转眼已经3月底了. 而微软之前所公布的Win10 2004版也即将推送,这是Win10系统的第九次重大更新,它在多方面进行了更改调整,尽可能地提高安全性和整体生产力. 说实话,win10系统自 ...

  8. 关于vmstat,top,ps aux查看的cpu占用率不一致的问题

    问题: 用vmstat,top,和ps aux三个命令查看进程对cpu的占用率,数值差异很大. 例: 用 vmstat 查看系统cpu空闲率, id是cpu的空闲率,可以看出,空闲率一直在73%以上 ...

  9. intellij idea cpu占用率太大太满 运行速度太慢解决方案

    intellij idea cpu占用率太大太满 运行速度太慢解决方案 参考文章: (1)intellij idea cpu占用率太大太满 运行速度太慢解决方案 (2)https://www.cnbl ...

  10. linux cpu占用率 监控工具 简介

    目录 1. top 1.1 /proc/loadavg 1.2 top使用 2. perf 3. sar.ksar 4. mpstat 5. uptime 6. vmstat 7. pidstat 7 ...

最新文章

  1. 3.1.10 基本分段存储管理方式
  2. [?]Oracle 10g sqlplus 的Bug?
  3. 构建之法第四章--两人合作
  4. 对HTTP基本认识(HTTP协议入门必备)
  5. SQL注入:6、SQLMAP的使用
  6. 元宵快乐:看SQL大师们用SQL绘制的团圆
  7. 规则引擎--规则引擎构成重点
  8. 一套C#图书管理系统源码 书籍借还登记统计系统源码
  9. python中聚类和分类的区别_聚类与分类有什么区别?
  10. java 调用ejb_一步一步教你远程调用EJB
  11. Mac: Mac 截长屏
  12. photoshop中魔棒使用方法
  13. 【pion】ice-single-port解析
  14. 下载jdk(所有版本)
  15. Linux中/proc目录下文件详解 /proc/devices文件 /proc/modules文件
  16. 计算机算法设计与分析第五章思维导图知识点总结 ( 初稿 )
  17. 如何利用 Python + Selenium 自动化快速截图
  18. 博士申请 | 美国圣路易斯华盛顿大学王晨光老师招收NLP方向全奖博士/博后/硕士...
  19. 深度学习损失函数——“dice_coeff”代码实现
  20. 网络布线与施工技术-2

热门文章

  1. LabWindows/CVI 调用Microsoft Access Database数据库方法
  2. 基于残差神经网络的交通标志识别算法研究与应用实现
  3. 苹果微信分身多开版ios下载
  4. [编程题] 彩色瓷砖
  5. 通过 FTP 从 Windows 向 Linux 拷贝文件之后,文件的权限很可能会变化,要检查
  6. android种textView过长自动打省略号
  7. java 自动检查更新去掉勾,小熊纯净版Win10旗舰版如何关闭java自动更新功能
  8. 2022年湖南省安全保护服务人员(初级保安员)考试练习题及答案
  9. 源码时代教你免费下载被网站保护的图片,这招百试百灵!
  10. python制作音乐相册_阿里大牛教你做Python炫酷音乐海报,拿去跟小伙伴炫耀!