目录

三 内核的运行

5-中断子系统

6 锁、延迟与原子上下文

7 内存管理子系统

8 驱动的两类框架


三 内核的运行

5-中断子系统

中断子系统的数据结构及设计思想

中断子系统需要解决中断管理的问题。

如果系统中断较少的话,其管理就不用设计这样一个中断子系统这么麻烦了。

但是现代CPU功能越来越强大,越来越复杂,自然支持的中断数量也不断增加。

中断由专门的中断控制器在硬件层面管理,另外还存在中断嵌套的问题,这样中断号就可能冲突(重叠或重复)

为了总揽中断处理,内核设计了多个数据结构,完善对中断的管理。这些数据结构包括:

irq_desc,中断描述结构,包含中断的数据,中断的处理函数指针列表,以及相关的其他信息,比如父中断、任务相关信息

一个实际的中断会对应到一个irq_desc,结构,系统创建时候,会初始化一个irq_desc全局列表(数组),每当驱动调用request_irq请求中断时,

就在irq的全局列表中找到一个对应的节点(如果申请的中断号存在的话,则复用已有的,如果没有的话,就新分配一个给当前中断号)

当前申请中断的回调函数就会挂载到该描述符的action列表上,当中断产生后,会根据硬件中断号找到软件中断号进而找到该描述符,遍历执行挂接其上的回调函数

irq_data,中断数据结构体,该数据结构包含了当前软件中断号及其对应的硬件中断号,也包含了irq_chip和irq_domain结构指针。

这个数据结构会在多个接口的参数中传递,用于把整个中断链条粘起来

irq_chip结构表示了一个中断控制器,这个结构里预定义了多个函数指针,主要用来进行中断控制器的一些操作,比如屏蔽、取消中断屏蔽等

irq_domain结构表示了一个中断控制器管理的中断。通过该接口,中断控制器要建立该中断控制器管理的中断的映射关系。

主要的映射关系有三种,包括线性映射,radix树映射,直接映射。

中断子系统的构建:启动代码

内核启动时,完成中断系统的构建,也就是描述符表的初始化,中断控制器驱动的加载,完成中断子系统的初始化。

中断是系统正常运行的基础子系统,许多模块的正常运行依赖该子系统,所以,需要较早初始化。

即使这样,中断也有其依赖的部分,比如内存分配,所以,内存的初始化要放在其前面,另外CPU本身的初始化也是最初要做的。

上述工作会在CPU中断关闭的情况下进行。因为这个阶段,即使产生中断,也是没有意义的,没有谁去处理它。

笼统的来讲,所有中断子系统用到的东西都必须先于其构建,比如像radix树之类的。

这之后,内核调用early_irq_init();和init_IRQ();构建中断子系统。

第一个接口完成中断描述符相关内容的构建,第二个接口一般是平台相关的调用。比如,接口中进一步调用machine_desc->init_irq();完成具体平台的中断初始化。

对于海思平台,在其march-hisi中的core.c中定义了这里用到的machine,进一步的会调用hi3536_gic_init_irq完成平台中断的初始化。

平台部分会做一些额外或者也可能不做,最终会调用通用中断初始化接口gic_init_bases

网上介绍的gic_of_init初始化接口,也会调用到上述接口上,殊途同归吧。

在这个接口里,会完成CPU内置中断0-31号的配置,完成GIC通用中断控制器的创建和映射关系建立,以及用户定义中断的配置

另外,这里会使用CPU的中断相关寄存器地址。hisi平台machine在调用通用中断初始化接口时,会传递海思平台的寄存器地址,完成海思平台中断子系统的初始化

中断子系统的运行:如何使用上述构建的中断世界(结构)

现在我们来看,中断系统的运行流程(过程)。

系统启动时已经完成了基本的中断系统构建。

驱动申请中断时,主要是根据中断类型、中断号等信息,将当前设备的中断处理程序挂接到中断描述符结构上,全局的中断描述符。

当中断产生后,会一级一级向上传导到中断控制器,最终到CPU。CPU响应中断后,会获取到当前最终一级的中断号。

这个中断号是硬件的,通过该中断号,一级一级向下传导。先通过irq_chip这个代表中断控制器的结构,关闭或者屏蔽当前中断控制器的中断,

进一步的结合中断数据,查找到软件中断号,找到中断描述符

遍历并调用中断描述符上的处理函数指针列表。

具体是那个最下一级设备最终产生的中断,这就要交给中断处理函数了。

在驱动申请中断时,预先定义了中断处理函数。驱动需要判断当中断处理函数被调用时,是否是当前设备产生了中断,这可以通过读取设备的中断寄存器来完成判决。

其实中断的申请分共享和非共享,对于非共享中断,此时应该就是也必须是设备的中断触发其中断处理函数,否则,说明系统中断部分的映射有问题。

6 锁、延迟与原子上下文

软中断上下文中调用msleep进行调度出错

tasklet 中调用msleep,产生调度出错

struct work

全局共享队列不能延迟调度,因为是默认内核专门的线程,该线程应该是不能延迟操作?

专有共享队列可以延迟调度?

这里的延迟是延迟固定时间后放到队列中?

因为队列中的work什么时候执行要看之前的work什么时候执行完成

定时器执行上下文是软中断,所以也是属于原子上下文

  <4> msec to jiffies is 100 <3>BUG: scheduling while atomic: swapper/1/0/0x00000100<4>Modules linked in: testdrv(O) hi_rtc(O) hi_ir(O) hi3536_adec(PO) hi3536_aenc(PO) hi3536_ao(PO) hi3536_ai(PO) hi3536_aio(PO) acodec(PO) gpioi2c(O) hi3536_ive(PO) hi3536_vda(PO) hi3536_jpege(PO) hi3536_h264e(PO) hi3536_chnl(PO) hi3536_venc(PO) hi3536_rc(PO) hi3536_hdmi(O) hifb(PO) hi3536_vou(PO) hi3536_vpss(PO) hi3536_viu(PO) hi3536_vgs(PO) hi3536_region(PO) hi3536_tde(PO) hi3536_jpegd(O) hi3536_vfmw(PO) hi3536_vdec(PO) hi3536_sys(PO) hi3536_base(PO) hiuser(O) hi_media(O) mmz(O) stmmac [last unloaded: testdrv]<4>CPU: 1 PID: 0 Comm: swapper/1 Tainted: P           O 3.10.0_hi3536 #38<4>[<c0019d30>] (unwind_backtrace+0x0/0xf4) from [<c0016de4>] (show_stack+0x10/0x14)<4>[<c0016de4>] (show_stack+0x10/0x14) from [<c0546340>] (__schedule_bug+0x50/0x64)<4>[<c0546340>] (__schedule_bug+0x50/0x64) from [<c054c454>] (__schedule+0x4f0/0x5d8)<4>[<c054c454>] (__schedule+0x4f0/0x5d8) from [<c054a9e0>] (schedule_timeout+0x130/0x1ac)<4>[<c054a9e0>] (schedule_timeout+0x130/0x1ac) from [<c00322d8>] (msleep+0x2c/0x38)<4>[<c00322d8>] (msleep+0x2c/0x38) from [<c0032374>] (call_timer_fn.isra.30+0x24/0x88)<4>[<c0032374>] (call_timer_fn.isra.30+0x24/0x88) from [<c003256c>] (run_timer_softirq+0x194/0x210)<4>[<c003256c>] (run_timer_softirq+0x194/0x210) from [<c002bb54>] (__do_softirq+0x124/0x204)<4>[<c002bb54>] (__do_softirq+0x124/0x204) from [<c002bf6c>] (irq_exit+0x9c/0xd0)<4>[<c002bf6c>] (irq_exit+0x9c/0xd0) from [<c0013ea0>] (handle_IRQ+0x44/0x90)<4>[<c0013ea0>] (handle_IRQ+0x44/0x90) from [<c0008514>] (gic_handle_irq+0x34/0x8c)<4>[<c0008514>] (gic_handle_irq+0x34/0x8c) from [<c0012bc0>] (__irq_svc+0x40/0x50)<4>Exception stack(0xcf867f98 to 0xcf867fe0)<4>7f80:                                                       c09ae930 00000000<4>7fa0: 002a87a4 00000000 c077f3e5 c074dd50 c054fe6c cf866000 c077f3e5 cf866000<4>7fc0: cf866000 c074dcf0 00000000 cf867fe0 c00142a4 c00142a8 60000013 ffffffff<4>[<c0012bc0>] (__irq_svc+0x40/0x50) from [<c00142a8>] (arch_cpu_idle+0x2c/0x30)<4>[<c00142a8>] (arch_cpu_idle+0x2c/0x30) from [<c005b360>] (cpu_startup_entry+0xfc/0x140)<4>[<c005b360>] (cpu_startup_entry+0xfc/0x140) from [<40542804>] (0x40542804)<3>bad: scheduling from the idle thread!<4>CPU: 1 PID: 0 Comm: swapper/1 Tainted: P        W  O 3.10.0_hi3536 #38<4>[<c0019d30>] (unwind_backtrace+0x0/0xf4) from [<c0016de4>] (show_stack+0x10/0x14)<4>[<c0016de4>] (show_stack+0x10/0x14) from [<c0050ab4>] (dequeue_task_idle+0x34/0x40)<4>[<c0050ab4>] (dequeue_task_idle+0x34/0x40) from [<c054c240>] (__schedule+0x2dc/0x5d8)<4>[<c054c240>] (__schedule+0x2dc/0x5d8) from [<c054a9e0>] (schedule_timeout+0x130/0x1ac)<4>[<c054a9e0>] (schedule_timeout+0x130/0x1ac) from [<c00322d8>] (msleep+0x2c/0x38)<4>[<c00322d8>] (msleep+0x2c/0x38) from [<c0032374>] (call_timer_fn.isra.30+0x24/0x88)<4>[<c0032374>] (call_timer_fn.isra.30+0x24/0x88) from [<c003256c>] (run_timer_softirq+0x194/0x210)<4>[<c003256c>] (run_timer_softirq+0x194/0x210) from [<c002bb54>] (__do_softirq+0x124/0x204)<4>[<c002bb54>] (__do_softirq+0x124/0x204) from [<c002bf6c>] (irq_exit+0x9c/0xd0)<4>[<c002bf6c>] (irq_exit+0x9c/0xd0) from [<c0013ea0>] (handle_IRQ+0x44/0x90)<4>[<c0013ea0>] (handle_IRQ+0x44/0x90) from [<c0008514>] (gic_handle_irq+0x34/0x8c)<4>[<c0008514>] (gic_handle_irq+0x34/0x8c) from [<c0012bc0>] (__irq_svc+0x40/0x50)<4>Exception stack(0xcf867f98 to 0xcf867fe0)

关于锁,需要关注一些跟硬件相关的特性或者手段更为贴切。

原子操作,汇编层面使用,CPU内部特性保证

内存屏障,汇编层面使用,CPU内部特性保证

RCU

https://zhuanlan.zhihu.com/p/88883239

https://blog.csdn.net/cfy_phonex/article/details/12090943

RCU 宽限期的概念,参考英文及知乎文档

也可参见博主的文章:

学内核之十三:关于RCU锁的一些思考_rcu 写锁_龙赤子的博客-CSDN博客

如果CPU层面没有相关手段,软件层面,可能需要特别处理中断,比如关闭中断,保证当前代码执行不被打断。

7 内存管理子系统

内存管理子系统在内核中占据了非常重要的位置

内存管理子系统也是系统中非常基础的模块,许多其他模块都依赖该模块,所以内存管理子系统在系统中初始化的位置很靠前

现代操作系统都采用了虚拟内存系统,以此提供进程间的共享、隔离和独立的不依赖物理内存大小的地址空间

Linux对物理内存进行了分区管理,提供了DMA区域、正常区域和高端区域

DMA区域针对某些物理设备可访问物理内存地址范围受限的情况,一般是在低地址区

正常区域为分页划分后供系统使用的内存,这部分内存的映射一般是固定映射,通常为一个固定偏移。内核地址空间3G到4G之间的低地址部分会映射到物理内存的对应低地址区域。

高端内存为正常区域之外的物理内存,这部分内存需要时,单独映射到内核地址空间,该映射非固定映射,需要时通过系统接口建立映射,用完释放。

上述区域的划分在不同平台可能有不同的实现,有的平台可能不存在高端内存,也可能不存在DMA区域。

内核对内存的分配有三层:

1 是获取和释放页面。这是最底层的接口。通过这类接口可直接获取物理内存页并使用。一般不建议通过该方法获取内存。

2 是通过kmalloc获取内存buffer。该接口基于1中的接口,但是中间增加了slab管理算法。通过slab算法,可以有效的管理物理内存。

相比第一种的页为单位的内存,通过该接口获取内存更灵活。当然,slab也是先通过1接口获取空闲页再进行管理后,提供给kmalloc调用者。

3 是通过vmalloc获取内存buffer。跟2比较,该接口获取的内存在虚拟空间中连续,物理地址不连续。可能是多个零散的物理页面通过映射表产生虚拟空间的连续内存。

显然,该接口获取内存对性能有一定损耗,所以一般也不用该接口,除非需要获取较大的物理内存。模块加载时通常通过该接口获取内存。

除了操作系统自身的内存管理需要,Linux操作系统还需要提供进程的内存管理。

进程的内存管理通过挂接到task结构体上的mm结构体进行管理。mm结构体进一步挂接vma结构体链表,具体对应用户进程的地址空间。

用户进程的/proc/xxx/mmap文件就是vma的对应,其中包括共享库、堆、栈、进程自身动态库、代码段、数据段等区块。一般,栈向下增长,堆向上增长。

对于内核进程来讲,是不存在上述mm结构体的,内核进程不需要共享库以及其他部分。内核进程之间是全局共享的,此处用内核线程更好理解。内核一个大进程,有很多线程。

内核堆栈代码段数据段等是在内核加载后逐步建立的,堆栈占用物理内存的固定区域,一般栈在最高地址处。其他内存通过调用分配函数完成。内存的使用没有差异,只是内核的内存映射在内核地址空间。

可以想象内核是一个大进程,所有内核线程和用户进程都共享内核地址空间。

对内存的使用,还需要考虑缓冲和CACHE。

虚拟内存通过MMU访问,但是也要看到,建立物理映射需要多次访问内存,对性能影响不小,特别是进程切换等操作,映射很容易失效。

系统提供TLB用于页表映射的CACHE,对性能提升有很大影响。一般页面的大小在4KB及以上,使用内存过程中根据空间相关性,同一页面的高频访问概率还是很大的,CACHE带来的效率提升会比较高。

随着现代64位系统的流行和应用的不断复杂化、膨胀化,应用对内存的消耗也在不断地增加。使用4KB的页面,可能导致出现频繁的页分配释放和CACHE miss。为应对这一情况,内核提供了巨页和透明大页的支持。

使用更大的的页面,可以减少分配次数,可以减少cache line 占用,对性能的提升有不少帮助。但同时也要看到,大页也有其不利的一面,比如利用率(可能造成浪费)、分配成功率等。需要平衡考虑。

8 驱动的两类框架

框架一,模板化

框架二,抽象化、分层化

open 设备节点到驱动接口

  <4>[<c054d1b4>] (mutex_lock+0xc/0x4c) from [<bf882174>] (cdevdev_open+0x20/0x3c [testdrv])<4>[<bf882174>] (cdevdev_open+0x20/0x3c [testdrv]) from [<c00c2f38>] (chrdev_open+0xc4/0x1ac)<4>[<c00c2f38>] (chrdev_open+0xc4/0x1ac) from [<c00bd2a0>] (do_dentry_open.isra.16+0x164/0x258)<4>[<c00bd2a0>] (do_dentry_open.isra.16+0x164/0x258) from [<c00bd3b4>] (finish_open+0x20/0x38)<4>[<c00bd3b4>] (finish_open+0x20/0x38) from [<c00cb3c0>] (do_last.isra.54+0x3bc/0xc24)<4>[<c00cb3c0>] (do_last.isra.54+0x3bc/0xc24) from [<c00cbcd4>] (path_openat.isra.55+0xac/0x470)<4>[<c00cbcd4>] (path_openat.isra.55+0xac/0x470) from [<c00ccce4>] (do_filp_open+0x2c/0x80)<4>[<c00ccce4>] (do_filp_open+0x2c/0x80) from [<c00be320>] (do_sys_open+0xe8/0x170)<4>[<c00be320>] (do_sys_open+0xe8/0x170) from [<c0012f80>] (ret_fast_syscall+0x0/0x30)

Linux系统之Uboot、Kernel、Busybox思考之三相关推荐

  1. RK3399-SD卡linux系统制作(uboot,kernel内核,根文件)

    从sd卡启动:原文链接:https://blog.csdn.net/weixin_45746588/article/details/107952681 1.VM虚拟机安装和PC端ubuntu系统安装 ...

  2. 【嵌入式】构建嵌入式Linux系统(uboot、内核、文件系统)

    知识架构及层次 Linux内核由三部分构成: Bootloader:启动引导系统(可执行文件) Kernel:内核(可执行文件) Root File System:根文件系统 嵌入式Linux系统构成 ...

  3. Linux系统高并发kernel参数优化

    众所周知在默认参数情况下Linux对高并发支持并不好,主要受限于单进程最大打开文件数限制.内核TCP参数方面和IO事件分配机制等.下面就从几方面来调整使Linux系统能够支持高并发环境. iptabl ...

  4. Linux系统之Uboot、Kernel、Busybox思考之四

    目录 三 内核的运行 9 设备树: 1) 设备树产生缘由 2) 设备树方案的流程 3) 有了上述概念,为了支撑整个设备树的工程实现,内核实现以下内容 4) 内核解析设备树 5) 入口分析 6) 解析处 ...

  5. Linux系统从uboot到内核启动流程

    1. BROM引导: ARM CPU刚上电时,它的PC寄存器指针指向IC内嵌的一片ROM的起始位置处,这片ROM称之为BROM(boot rom),系统就是通过这片BROM引导起来的.BROM的空间比 ...

  6. linux系统中uboot的基本原理与实现方法

    大家好,今天主要和大家聊一聊,U-boot的操作与实现方法. 目录 第一:U-boot基本简介 第二:u-boot烧写与启动方法 第三:uboot中信息查询命令 第一:U-boot基本简介 linux ...

  7. Linux 系统裁剪--制作一个最小化的Linux iso镜像

    1.前言 一直以来都想制作一个最小化的Linux系统,这个小系统需要有常用的Linux 命令,以及定制化的某些功能.可是由于种种原因一直没能实现,最近终于有时间把它做了出来. 本文所说的精简的Linu ...

  8. 安装linux系统initrd,制作initrd(5):解剖Ubuntu安装盘

    ubuntu定期更新他们的iso,iso引导系统后会有Try/Install Ubuntu两个选项.特别是选择了livecd,仅仅一张盘子就能运行一个图形化的linux,总觉得挺神奇的.在好奇心的推动 ...

  9. Linux系统后缀都是ISO,请问文件的后缀名为ISO的是什么文件

    请问文件的后缀名为ISO的是什么文件 來源:互聯網  2009-04-12 00:27:15  評論 分類: 電腦/網絡 >> 軟件 >> 其他軟件 參考答案: 1.什么是IS ...

最新文章

  1. linux pytorch 快速安装
  2. Docker Compose部署GitLab服务,搭建自己的代码托管平台(图文教程)
  3. java建一个conversion_Scala中的JavaConverters和JavaConversions之间有什么区别?
  4. vue隐藏浏览器_一分钟学会Vue的条件渲染和列表渲染
  5. 低代码发展专访系列之四:低代码平台会带动企业的组织变革吗?
  6. 20 WM配置-策略-定义出库排序序列(拣配)
  7. 判断设置两天后时间,时间戳
  8. 8.2-HSRP 第二次:重新搭建拓扑 //IOU
  9. css 列表属性详细总结
  10. LabVIEW前面板数值控件显示7段LED数码管样式
  11. 【Web前端】儿童摄影网——网页制作代码
  12. 遗传算法求解立体仓库货位优化
  13. php ecshop二次开发,ecshop二次开发对ecshop系统框架分析
  14. 什么是小规模纳税人、小型微利企业、小微企业
  15. Android柱状图
  16. 干货丨时序数据库DolphinDB脚本语言的混合范式编程
  17. IE浏览器控制台空白
  18. 《金匮要略》试卷二(A)
  19. 【模型压缩】蒸馏神经网络(Distill the Knowledge in a Neural Network)
  20. 信息安全网络安全到底有哪些资质?被大家追逐。。。

热门文章

  1. 51单片机模拟I2C协议
  2. 新版中智交易所bzizan源码Java开发+带文档说明
  3. PyTorch实现基于ResNet18迁移学习的宝可梦数据集分类
  4. web前端对接海康大华视频
  5. elasticsearch ngram和edgengram分词器
  6. PEG-PDPA-PAMA 聚乙二醇-甲基丙烯酸氨基乙酯-甲基丙烯酸二异丙基氨基乙酯
  7. scikit-learn: isotonic regression(保序回归,非常有意思,仅做知识点了解,但差点儿没用到过)...
  8. 代码随想录之路经总和
  9. 解除R中从github上下载包API限制的问题(Error: Failed to install ‘unknown package‘ from GitHub: HTTP error 403. )
  10. ngnix、tinyproxy搭建http正向代理