#####阅读五分钟,每日十点,和您一起终身学习,这里是程序员Android

本篇文章主要介绍 Android 开发中的部分知识点,通过阅读本篇文章,您将收获以下内容:

一、 AEE 系统机制简介 二、AEE 重启异常分类介绍 三、重启问题快速分析归类指南之 Kernel Exception 四、重启问题快速分析归类指南之 Watchdog Timeout 五、重启问题快速分析归类指南之 Hardware Reboot

#一、 AEE 系统机制简介

1.MTK AEE 系统

AEE 是 MTK平台自研,用于侦测Android手机系统异常重启的一套系统机制,当AEE系统 侦测到异常后会生成 db 文件.

2.db 文件存储路径:

/data/aee_exp 或 data/vendor/mtklog/aee_exp

Android 8.0 之后由于系统安全机制导致db无法保存到MTK log中 user版本 中AEE仅仅侦测引起的重启故障,例如:KE/system server , NE/system server ,JE/SWT 。

3.AEE 异常侦测机制

AP层重启时候,AEE系统会在db生成后会发生am 广播(com.mediatek.log2server.EXCEPTION_HAPPEND),但系统重启类异常(KE / HW reboot/ HWT)不会发送广播,因为AMS还无法使用。

另外,AEE会开机后判断异常重启,当异常重启后会设置debug.mtk.aee.db的 property,由于不是persist的,关机就丢失,因此只有异常重启后才有这个property存在。

因此,我们可以通过检查debug.mtk.aee.db的方法来获取系统是否发生了异常重启。

4.重启异常 debug.mtk.aee.db 读取方法

1.java 层:

android.os.SystemProperties.get("debug.mtk.aee.db", "")

native层:

int property_get(const char* key, char* value, const char* def);

通过adb shell

adb shell getprop debug.mtk.aee.db

二、AEE 重启异常分类介绍

AEE 重启异常分类 如下:

1.KE

2.HWT

3.HWT Reboot

4.NE

5.JE

6.SWT

上面的类型可能会变化,具体请参考kernel代码:kernel-4.4/drivers/misc/mediatek/include/mt-plat/aee.h里的AE_EXP_CLASS。

1.AEE 输出内容

当有异常发生时候,会生成dbg文件,通过特殊的工具可以解压这个dbg文件。

关注微信公众号: 程序员Android 回复 aee 即可获取解析重启db log的工具。

2.dbg文件

db.fatal.00.JE.dbg.DEC 这个文件夹使用aee_extract.exe抽取aee db压缩文件生成的,这个工具在gat-win32-3\prebuilt\spsstools\bin\aee_extract.exe可以找到。

3.ZZ_INTERNAL 简介

ZZ_INTERNAL 包含重启的简单信息,如需获取更多信息,需要解压dbg文件。

4.KE、JE、NE、SWT分类

这种类型最好分类,因为有调用栈,有进程名,分类可以做的很细致。

KE db如果存在SYSTRACKER_DUMP文件,表示存在bus hang,也可以单独列出来。

5. HWT分类

不能以当前CPU的调用栈分类。因为最后调用BUG的CPU是随机的。同样的调用栈,可能是不同的root cause,应该按卡住的CPU的调用栈进行分类

从SYS_LAST_KMSG看Kick bit、check bit得出无喂狗CPU,可能存在多个或没有。 从SYS_LAST_KMSG提取无喂狗CPU的调用栈

6.HW reboot分类

可以通过__exp_main.txt里的Exception Type分类

HW reboot

Thermal reboot

SPM reboot

ATF crash

Type为HW reboot可以进一步细分( 按SYS_REBOOT_REASON里字段信息 )

last pc,看各个Core停止的位置

deepidle/sodi3/sodi/spm_suspend,如果非0表示当时处于low power场景

Android Dropbox

三、重启问题快速分析归类指南之 Kernel Exception

当手机重启时候,Kernel重启异常信息会保存在手机/data/aee_exp或 data/vendor/mtklog/aee_exp 中的db文件中。

Kernel Exception重启分类如下:

1.Kernel Panic

2.Watchdog Timeout

3.Hardware Reboot

1.Kernel Panic

即Linux kernel发生了无法修复的错误,从而导致 panic。通过查看 SYS_KERNEL_LOG 的内容.

kernel Panic 进一步可以分为如下几类:

普通的data abort

oom主动触发的panic

3.undefined instruction,未定义指令异常

4.bad mode异常,即PC处于一个无效的virtual address

###1. 普通的data abort

从SYS_KERNEL_LOG中,可以检索到如下关键信息: Unable to handle kernel NULL pointer dereference at virtual address XXXXXXXX 如上的XXXXXXXX代表某个非法地址。这种类型是最多的。

2. oom 主动触发的panic

从SYS_KERNEL_LOG中,可以检索到如下关键信息: Kernel panic - not syncing: Out of memory and no killable processes...

此种类型的panic一般是某个process或者APK耗尽了memory资源,从而kernel主动触发的panic重启。

3.undefined instruction,未定义指令异常

从SYS_KERNEL_LOG中,可以检索到如下关键信息:

Internal error: Oops - undefined instruction

此类异常较为少见,可能是CPU/DRAM 不稳定或者受干扰导致的问题。

4.bad mode异常,即PC处于一个无效的virtual address

从SYS_KERNEL_LOG中,可以检索到如下关键信息: Bad mode in Synchronous Abort handler detected [14820.652408]-(1)[682:VSyncThread_0][] bad_mode+0x78/0xb0 此类异常较为少见,可能的原因是stack错乱,或者未注册回调函数引起。

四、重启问题快速分析归类指南之 Watchdog Timeout

看门狗超时有两种

1.底层看门狗超时HWT

2.上层hang_detect 触发看门狗超时SWT

###1.底层看门狗超时HWT 从SYS_KERNEL_LOG中,可以检索如下关键信息

arm64 平台

PC is at aee_wdt_atf_info+0x4c8/0x6dc

LR is at aee_wdt_atf_info+0x4c0/0x6dc

arm32 平台

PC is at aee_wdt_irq_info+0x104/0x12c

LR is at aee_wdt_irq_info+0x104/0x12c

此类异常较为常见,多见于底层频繁irq/bus卡死,导致kicker无法被schedule,从而引起watch dog触发中断,引导系统进入FIQ处理流程,最终call到BUG触发重启。

###2. 上层hang_detect 触发看门狗超时SWT

从SYS_KERNEL_LOG中,可以检索( 关键字 :hang_detect)

[ 2131.086562] (0)[77:hang_detect][Hang_Detect] we should triger HWT ...

...

[ 2180.467416]-(0)[77:hang_detect]PC is at aee_wdt_irq_info+0x154/0x170

[ 2180.467426]-(0)[77:hang_detect]LR is at aee_wdt_irq_info+0x154/0x170

...

此异常类型较为常见,多见于GPU/SD卡/eMMC无法满足surfacelinger/system_server的通讯需求,从而导致上层卡死,进而主动触发看门狗超时重启。

#五、重启问题快速分析归类指南之 Hardware Reboot

Hardware reboot是watch dog直接发出reset信号,导致整个系统重启;在重启之前,并没有触发任何异常处理流程。

一般情况下,hardware reboot对应的db不会有SYS_KERNEL_LOG 可以排查,只能从SYS_LAST_KMSG获知异常之前kernel的动作,以及从SYS_REBOOT_REASON获知异常时的CPU寄存器值和其它参数。

从ZZ_INTERNAL 档案,可以知道发生了hardware reboot 例如 如下部分log: Hardware Reboot,0,0,99,/data/core/,0,,HW_REBOOT,Fri Jul 3 14:31:53 CST 2015,1 至此,本篇已结束,如有不对的地方,欢迎您的建议与指正。同时期待您的关注,感谢您的阅读,谢谢!

android手动触发ke,手机重启问题快速分析定位指南相关推荐

  1. [Android]手动触发OnClick事件

    一.实现代码 1.1 将下面代码写在类中,注意不是方法内部!     OnClickListener OnClickEvent = new OnClickListener(){             ...

  2. MTK-Android 异常重启 AEE 分析定位

    本篇文章主要介绍 Android 开发中的部分知识点,通过阅读本篇文章,您将收获以下内容: 一.AEE 系统机制简介 二.AEE 重启异常分类介绍 三.重启问题之 Kernel Exception 四 ...

  3. MTK平台手机重启问题分析

    阅读五分钟,每日十点,和您一起终身学习,这里是程序员Android 本篇文章主要介绍 Android 开发中的部分知识点,通过阅读本篇文章,您将收获以下内容: 一.AEE 系统机制简介 二.AEE 重 ...

  4. Android 手机重启相关内容

    极力推荐Android 开发大总结文章:欢迎收藏 程序员Android 力荐 ,Android 开发者需要的必备技能 本篇文章主要介绍 Android 开发中的部分知识点,通过阅读本篇文章,您将收获以 ...

  5. Android 手机重启解决方案

    本篇文章主要介绍 Android 开发中的部分知识点,通过阅读本篇文章,您将收获以下内容: 1.MTK 平台AEE 搜集重启问题介绍 欢迎关注微信公众号:程序员Android 微信公众号:Progra ...

  6. Android 系统(126)---Android的死机、重启问题分析方法

    Android的死机.重启问题分析方法 阅读数:11986 Android的死机.重启问题分析方法 1.     死机现象 1.1      死机定义 当手机长时间无法再被用户控制操作时,我们称为死机 ...

  7. Android的死机、重启问题分析方法

    Android的死机.重启问题分析方法 原文链接:https://blog.csdn.net/jinlu7611/article/details/50592385 1.死机现象 1.1 死机定义 当手 ...

  8. Android开发实战《手机安全卫士》——3.“手机防盗”模块实现 .9格式图片说明 数据库操作 平移动画

    文章目录 1.手机防盗--密码加密过程 & 加密后的验证 2.手机防盗--对话框展示样式兼容低版本 3.手机防盗--设置界面 & 功能列表界面跳转逻辑处理 4.手机防盗--导航界面的布 ...

  9. Android之MediaProjectionManager实现手机截屏总结

    比较好的文章: Android中使用代码截图的各种方法总结 http://blog.csdn.net/woshinia/article/details/11520403 手机截屏: http://ww ...

最新文章

  1. 在.NET 3.5 平台上使用LINQ to SQL创建三层/多层Web应用系统(Part2) 转
  2. chart绑定mysql数据源_MSChart图表之Chart组件 学习一篇(5个主要属性+数据源绑定)...
  3. MS SQL 导入导出 提示 未在本地计算机上注册“Microsoft.ACE.Oledb.12.0”提供程序。(System.Data)...
  4. Edge on Linux?微软:会有的,但不是现在
  5. python文本结构化处理_在Python中标记非结构化文本数据
  6. 走,去抖音上发财!抖音承诺未来一年要帮一千万创作者赚到钱
  7. python有趣小程序-抖音最火的整蛊表白小程序如何做出来的?教你用python做出
  8. mongodb 导出txt_MongoDB导出软件
  9. 马哥【直播班】Python运维自动化与DevOps项目特训班学习记录
  10. 使用C语言--判断素数的两种方法
  11. GIS | 坐标系统与地图投影
  12. 谷歌浏览器Chrome快速打开Internet选项
  13. python里使用正则表达式搜索单词
  14. ovs-vsctl设置ofport不成功处理
  15. 图灵完备 java_图灵完备是什么?
  16. 开启mysql服务注意事项
  17. PostGreSQL语法及高级功能(2022-06-08补充中)
  18. mysql 外键报错_MySQL添加外键、删除外键方式,MySQL删除外键报错快速解决方案...
  19. SQL注入的原理、过程及如何防范
  20. JavaScript(红宝书)(一)

热门文章

  1. 09_keras_Tuner使用keras Tuner调整超参数(超参数优化)
  2. Android开发经验谈:微信小程序的事件处理,灵魂拷问
  3. 使用Altium Designer 18绘制stm32最小系统的电路原理图
  4. 中国没有乔布斯,美国没有史玉柱
  5. pyinstaller打包使用
  6. Dreamweaver CS4 解决序列号过期问题 OS XP
  7. 奇偶校验的快捷判断方法---按位异或
  8. WebSestalt,好用的富集分析工具,介绍及使用教程
  9. S32DS中.ld(链接)文件学习
  10. 树莓派官方摄像头detected=0问题