TI DSP TMS320C66x (1)硬件介绍
目录
- 概述
- C66x处理器内核
- C66x流水线结构
概述
C66X DSP是最新一代定点和浮点DSP,由4个乘法器组成,以实施单精度浮点运算。C66X DSP内核可同时运行多大8项浮点乘法运算,加之高达1.4GHz的时钟频率,使其具有很高的浮点处理性能。将多个C66x DSP内核与其他内核融合,即可创建出具有初中性能的多核片上系统器件。本文以TMS320C6678为例,介绍C66x内核。
TMS320C6678具有8个C66x内核,内核工作主频最高可达1.4GHz,理论上具有179.2(22.4x8)GFLOP和358.4(44.8x8)GMAC的处理性能。每个处理器内部有多级存储器:C66x内核中有L1P、L1D、L2SRAM;多核共享存储器为MSM SRAM。处理器具有多核导航器、网络协处理器、数据包加速器、信号量、PLL等多核共享的一些外部资源,同时提供如SRIO、PCIE、EMIF等多种外部接口。C6678的处理器架构如下图所示:
C66x处理器内核
C66x内核是C6678处理器的核心,用于完成高性能处理任务。
C66x内核由以下组件组成:C66xDSP、一级程序存储器控制器(L1P)、一级数据存储器控制器(L1D)、二级存储器控制(L2)、外部存储器控制器(EMC)、扩展存储器控制器(XMC)、带宽管理(BWM)、中断控制器和休眠控制器(PDC)组成。内核结构如下:
C66xDSP由8个功能单元,2个寄存器组和2条数据通路组成,结构如下图所示。两个寄存器组共有64个寄存器,分为A和B两组,每组由32个32-bit寄存器组成。通用寄存器可以用来存放数据,也可以当作地址指针。所支持的类型有8-bit打包数据,16-bit打包数据,32-bit数据,40-bit数据和64-bit数据,乘法支持128-bit数据。
8个功能存储单元(.L1 .S1 .M1 .D1 .L2 .S2 .D2 .S2),每个功能单元的每个时钟周期都能够执行一条指令。.S单元执行通常的移位、分支及比较程序,.L单元执行通常的算数及逻辑程序;所有乘法指令都在.M单元执行(一个.M单元包含16组16x16bit乘法器,1个周期内可执行一次单精度浮点乘法运算,4个周期可执行一次双精度浮点乘法运算)。.D单元主要完成从存储器加载(load)数据到寄存器堆(register file),并从寄存器堆保存(store)结果到存储器。
C66x流水线结构
计算机流水线(Pipeline)是Intel首次在486芯片中开始使用的。在CPU中把指令的执行分成若干个不同的功能单元来实现,由若干个不同功能的电路单元组成一条指令处理流水线,然后将一条X86指令分成若干步后再由这些电路单元分别执行,这样就能实现在一个CPU时钟周期完成一条指令,因此提高CPU的运算速度。
C66x DSP的流水结构共分三个阶段:指令预取(Fetch)、指令解码(Decode)、指令执行(Execute)。各阶段的详细流水线结构如下:
阶段 | 流水名称 | 含义 |
---|---|---|
Fetch | PG | Program address generate:产生程序地址 |
PS | Program address send:发送程序地址 | |
PW | Program (memory) access ready wait:等待程序内存响应 | |
PR | Program fetch packet receive:接收从内存传回的指令包 | |
Decode | DP | Instruction dispatch:将指令分配到相应的功能单元 |
DC | Instruction decode:将指令在相应的功能单元进行译码 | |
Execute | E1 | 执行指令,不同指令拥有不同的执行流水操作 |
... | ||
E5 |
- Fetch阶段的流水操作图示:
- Decode 阶段的流水操作图示:
- Execute 阶段的流水操作图示:
TI DSP TMS320C66x (1)硬件介绍相关推荐
- TI DSP TMS320C66x学习笔记之通用并行端口uPP(二)
这是翻译TI官方文档<KeyStone Architecture Universal Parallel Port (uPP)>SPRUHG9有关通用并行端口uPP的内容(除寄存器部 ...
- TI DSP TMS320C66x学习笔记之SPI Nor Flash多核程序烧写
烧写工具链接: https://pan.baidu.com/s/1em4jWjbskpMmNd1uzscjjA 提取码: 82qg 经过一段时间的研究终于把TMS320C6657单核和双核的SPI N ...
- TI DSP TMS320C66x学习笔记之VLIB测试数据(三)
VLIB是TI提供的针对C6x优化过的视觉库,下载地址:http://software-dl.ti.com/libs/vlib/latest/index_FDS.html 提供40多个核心函数,主要实 ...
- TI DSP TMS320C66x学习笔记之DSP优化经验
此文是在http://blog.csdn.NET/guanchanghui/article/details/1181851基础上,通过自己的学习理解修改而来.暂且算作是自己的原创吧.如有侵权,联系,立 ...
- TI DSP TMS320C66x学习笔记之DSP优化经验(八-1)
此文是在http://blog.csdn.net/guanchanghui/article/details/1181851基础上,通过自己的学习理解修改而来.暂且算作是自己的原创吧.如有侵权,联系,立 ...
- Android 6 ti dsp,TI DSP TMS320C66x学习笔记之内联指令(c6x.h中文注释)(六)
/*****************************************************************************/ /* C6X.H v7.4.12 */ ...
- TI DSP TMS320C66x学习笔记之TI Imglib库相关函数(四)
图像分析 一.本节提供的函数描述,通常应用于图像分析应用. 图像边界和周长函数 边界和周界函数,即IMG_boundary和IMG_perimetcr两个函数.它们通常在结构视觉应用中作为结构算子. ...
- C6657核心板资料:基于TI DSP TMS320C6657、XC7K325T的高速数据处理核心板 375
基于TI DSP TMS320C6657.XC7K325T的高速数据处理核心板 一.板卡概述 该DSP+FPGA高速信号采集处理板由我公司自主研发,包含一片TI DSP TMS320C6657和 ...
- 375-基于TI DSP TMS320C6657、XC7K325T的高速数据处理核心板
基于TI DSP TMS320C6657.XC7K325T的高速数据处理核心板 一.板卡概述 该DSP+FPGA高速信号采集处理板由我公司自主研发,包含一片TI DSP TMS320C6657和 ...
最新文章
- 山东省百万奖金赛事来了!
- maven中心仓库OSSRH使用简介
- hadoop单机配置(非分布式)
- graphic头文件函数_graphics.h头文件
- 求圈地的方块数java,java实现第三届蓝桥杯方块填数
- Flutter ListView 下拉刷新与上拉加载更多
- php property 获取,JavaScript中如何获取和设置property属性代码详解
- 吴恩达|机器学习作业5.0.偏差与方差
- java开发工程师简历项目经验怎么写?应该注意哪些事项?
- windows系统查看局域网内所有已使用的IP
- 计算机用户名不显示,Windows10中设置不显示最后用户名的方法
- 【亲自实践能够下载的谷歌地图切片url地址】谷歌地图数据下载的尝试以及Python爬虫实现
- linux离线安装caddy,GitHub - scriptsboy/aria2: LACY:Linux一键安装Aria2 + Caddy + YAAW实现离线下载、在线播放。...
- 计算机主机硬盘的拆装,机械硬盘怎么拆开?机械硬盘拆卸方法
- 驱动开发---cc1: error: code model kernel does not support PIC mode(改文件Unhelp?try it)
- Excel 图表与数据透视表制作
- python-华三防火墙netconf编写移动策略
- Spring Cloud微服务简介
- python永久删除文件_Python彻底删除文件夹及其子文件方式
- 全球CORS网 部分站点数据下载链接
热门文章
- 好好学习-三种网络攻击模型
- C# web页面展示个性化表格
- ES6 箭头函数及this指向
- SpringBoot启动报错Error creating bean with name 'xx': Unsatisfied dependency expressed through field xx
- 个人收藏-学习SHarePoint比较不错的网站
- taobao.com 和 tmall.com 为什么能做到登录互通
- 联想小新潮7000原配固态硬盘参数
- 【转】超强、超详细Redis入门教程 ,建议收藏
- flex布局的justify-content属性写法注意事项
- python如何绘制柱状图