ARM流水线如何提高代码执行效率
关注+星标公众号,不错过精彩内容
编排 | strongerHuang
微信公众号 | 嵌入式专栏
为什么有些CPU的主频更低,但运算效率却更高呢?
比如:51单片机30M主频,STM32单片机20M主频,执行相同一段代码,主频更低的STM32所花的时间却更短。
这里就牵涉到CPU流水线的问题,本文围绕CPU流水线描述相关内容。
早期CPU流水线
1.流水线来源
流水线的概念来源于工业制造领域,以汽车装配为例来解释流水线的工作方式,假设装配一辆汽车需要四个步骤:
1.冲压:制作车身外壳和底盘等部件;
2.焊接:将冲压成形后的各部件焊接成车身;
3.涂装:将车身等主要部件清洗、化学处理、打磨、喷漆和烘干;
4.总装:将各部件(包括发动机和向外采购的零部件)组装成车;
汽车装配需要冲压、焊接、涂装和总装四个工人,最简单的方法是一辆汽车依次经过上述四个步骤装配完成之后,下一辆汽车才开始进行装配,最早期的工业制造就是采用的这种原始的方式,即同一时刻只有一辆汽车在装配。
不久之后人们发现,某个时段中一辆汽车在进行装配时,其它三个工人都处于闲置状态,显然这是对资源的极大浪费,于是思考出能有效利用资源的新方法,即在第一辆汽车经过冲压进入焊接工序的时候,立刻开始进行第二辆汽车的冲压,而不是等到第一辆汽车经过全部四个工序后才开始,这样在后续生产中就能够保证四个工人一直处于运行状态,不会造成人员的闲置。这样的生产方式就好似流水川流不息,因此被称为流水线。
2.CPU流水线
1989 年推出的 i486 处理器引入了五级流水线。这时,在 CPU 中不再仅运行一条指令,每一级流水线在同一时刻都运行着不同的指令。这个设计使得 i486 比同频率的 386 处理器性能提升了不止一倍。
五级流水线中的取指阶段将指令从指令缓存中取出(i486 中的指令缓存为 8KB);
第二级为译码阶段,将取出的指令翻译为具体的功能操作;
第三级为转址阶段,用来将内存地址和偏移进行转换;
第四级为执行阶段,指令在该阶段真正执行运算;
第五级为退出阶段,运算的结果被写回寄存器或者内存。
由于处理器同时运行了多条指令,大大提升了程序运行的性能。
CPU流水线技术
CPU流水线技术是一种将指令分解为多步,并让不同指令的各步操作重叠,从而实现几条指令并行处理,以加速程序运行过程的技术。
指令的每步有各自独立的电路来处理,每完成一步,就进到下一步,而前一步则处理后续指令。
采用流水线技术后,并没有加速单条指令的执行,每条指令的操作步骤一个也不能少,只是多条指令的不同操作步骤同时执行,因而从总体上看加快了指令流速度,缩短了程序执行时间。
流水线技术是通过增加计算机硬件来实现的。它要求各功能段能互相独立地工作,这就要增加硬件,相应地也加大了控制的复杂性。如果没有互相独立的操作部件,很可能会发生各种冲突。例如要能预取指令,就需增加指令的硬件电路,并把取来的指令存放到指令队列缓冲器中,使微处理器能同时进行取指令和分析、执行指令的操作。
---来自百度百科
流水线与代码执行效果
为什么说同主频的51单片机相比STM32执行效率低呢?
除了大家认为的8位和32位宽度区别之外,还有一个就是51单片机不支持流水线(也可以理解为单流水线),而STM32支持流水线。
Cortex‐M3处理器使用一个 3 级流水线。流水线的 3 级分别是:取指、解码和执行, 如图:
通过下面一张图来对比单流水线和多级流水线,你就更能明白为什么51单片机执行效率低了。
多级流水线优缺点
并非在所有情况下流水线技术都起作用,可能有一些缺点。如果一条指令流水线能够在每一个时脉周期接纳一条新的指令,被称为完整流水线(fully pipelined)。因流水线中的指令需要延迟处理而要等待数个时脉周期,被称为非完整流水线。
当一名程序员(或者组合者/编译者)编写组合代码(或者汇编码)时,他们会假定每个指令是循序运行的。而这个假设会使流水线无效。当此现象发生后程序会表现的不正常,而此现象就是危害。不过当前有提供几种技术来解决这些危害像是转发与延迟等。
1.优点
减少了处理器执行指令所需要的时脉周期,在通常情况下增加了指令的输入频率(issue-rate)。
一些集成电路,例如加法器或者乘法器,通过添加更多的环路使其工作得更快,如果以流水线替代,能相对地减少环路。
2.缺点
流水线处理器设计复杂度更高、生产成本更高;
流水线的处理器必须在数据路径中添加额外触发器。
非流水线处理器有固定指令位宽,流水线处理器的性能更难以预测,并且不同的程序之间的变化可能更大。
声明:本文素材来源网络,版权归原作者所有。如涉及作品版权问题,请与我联系删除。
------------ END ------------
●专栏《嵌入式工具》
●专栏《嵌入式开发》
●专栏《Keil教程》
●嵌入式专栏精选教程
关注公众号回复“加群”按规则加入技术交流群,回复“1024”查看更多内容。
点击“阅读原文”查看更多分享。
ARM流水线如何提高代码执行效率相关推荐
- 为什么CPU流水线会提高代码执行效率?
关注.星标公众号,不错过精彩内容 素材来源:网络 编辑整理:strongerHuang 为什么有些CPU的主频更低,但运算效率却更高呢? 比如:51单片机30M主频,STM32单片机20M主频,执行相 ...
- C:提高C代码运行效率的方法有哪些?列举几个提高代码执行效率的方法
文章目录 1.选择合适的算法 2.选择合适的数据结构 3.选择合适的数据类型 4.减少冗余拷贝或赋值次数 5.减少运算的强度 6.减少循环内耗时操作 7.其它 1.选择合适的算法 应该熟悉算法语言,知 ...
- 编写HTML提高编写代码的效率,优化innerHTML操作(提高代码执行效率)
例子:我们要实现的效果是当用户点击鼠标的时候,就在旧数据上追加若干新数据. 如果使用标准DOM的话,完整代码如下: test data document.onmousedown = function( ...
- 关于如何提高代码执行效率。
在编写程序时,如果在循环中使用到常量. 我们不必每次都 String send_flag = "常量"; 而是直接使用这个常量. ----------------------- ...
- 提高java代码执行效率的技巧
对于细节问题我一直认识不怎么深刻,改变我这个看法的是很多年前玩dnf的时候,辛辛苦苦刷来一身的史诗装备,最后却发现打出的伤害并没有想象中那么令人满意,甚至令人感到有点沮丧.后来舍友告诉我,你要注意细节 ...
- improve php,解析提高PHP执行效率
解析提高PHP执行效率 1.用单引号代替双引号来包含字符串,这样做会更快一些.因为PHP会在双引号包围的字符串中搜寻变量, 单引号则不会,注意:只有echo能这么做,它是一种可以把多个字符串当作参数的 ...
- 提高软件执行效率的几条原则
似乎有很多朋友对于我说的"避免使用WITH语句"持反对意见.理由是With语句可以提高执行效率. 的确With是可以稍微提高一些执行效率,但是这是以破坏代码可读性的代价来 ...
- 提高SQL执行效率的几点建议
提高SQL执行效率的几点建议: 1.尽量不要在where中包含子查询 2.关于时间的查询,尽量不要写成:where to_char(dif_date,'yyyy-mm-dd')=to_char('20 ...
- 《MATLAB专刊》——利用向量化编程提升MATLAB代码执行效率
文章目录 1. 实验说明 2. 实验结果 3. 源程序 3.1 绘图源程序 3.2 测试源程序 4. 参考资料 为了阐明采用向量化编程思路对于MATLAB双重 forforfor循环优化的效果,本文通 ...
最新文章
- 关于Reapeter的总结
- php 开源 流量统计,5款开源的PHP网站流量统计应用程序
- Facebook最新Libra币开发指南---接口服务器开发2
- C++ STL 常用查找算法
- 剑指offer--求1+1+3+....n的和
- SpringMVC常用配置-添加静态资源处理器-针对SpringMVC中静态资源无法访问的问题...
- ACM与Java -- 大整数类的常用函数一览表
- go中make、new和直接var的区别
- nuttx linux 编译,linux下建立nuttx开发环境
- vue 地图使用navigator_9 个实验 + 3 个项目,带你入门 Vue.js 3 !
- Git:取消合并方式
- java有哪些字体_java字体有哪些
- 小白能读懂的 《手把手教你学DSP(TMS320X281X)》第四章(2) gel文件
- 元胞自动机概念与实例
- 综述: 通信雷达一体化中的信号处理
- AForge Video
- 树莓派蜂鸣器唱歌c语言,关于蜂鸣器唱歌程序
- php网站后台密码忘记,phpweb忘记后台密码
- 如何解决电脑时间同步出错?
- 群体遗传学习笔记-基础篇
热门文章
- 重磅推出!安全扫码专业委员会数智商盟码上线了!!
- [转载] 七龙珠第一部——第043话 西都之家
- 网络基础12 二维码扫码登录原理
- id auto mysql_主键-使mysql表中的ID为auto_increment(在事实之后)
- 推荐14款最受欢迎的3d建模软件
- 新媒体运营人如何给自己赋能?
- Linux内核 mipi虚拟通道,基于NVP6324的4路模拟720P/1080P 视频输入方案
- 虹科案例 | 用AR进行建筑规划,这家公司竟已“走近”了元宇宙?
- Unity初始化预制件之后得位置问题
- 是男人就挺过二十秒源代码