【Datawhale可解释性机器学习笔记】预备知识学习
人工智能黑箱子灵魂之问
- AI的脑回路是怎样的?
- AI如何做出决策?
- 是否符合人类的直觉和常识
- 如何衡量不同特征对AI预测结果的不同贡献?
- AI什么时候work?AI什么时候不work?
- AI有没有过拟合?泛化能力如何?
- 会不会被黑客误导,让AI指鹿为马?
- 如果样本的某个特征变大15,会对AI预测结果产生什么影响?
- 如果AI误判,为什么会犯错?如何能不犯错?
- 两个AI预测结果不同,该信哪一个?
- 能让AI把学到的特征教给人类吗?
选择人工智能研究方向的建议
- 尽可能通用,与其他研究方向交叉
- 顺应主流发展趋势,长期存在且有用
- 有高质量的数据集
- 不过分小众,但也好发paper,没有疯狂内卷
- 能应用到产业界垂直细分产业
- 有商业应用价值,容易“讲故事”
(建议来自;同济子豪兄)
为什么要学可解释机器学习
- 研究AI的脑回路,就是研究AI的本质
- 可解释分析是机器学习和数据挖掘的通用研究方法。
- 和所有AI方向交叉融合:数据挖掘、CV、NLP、强化学习、知识图谱、联邦学习。
- 包括但不限于:大模型、弱监督、缺陷异常检测、细粒度分类、决策AI和强化学习、图神经网络、AI纠偏、AI4Science、Machine Teaching、对抗样本、可信计算、联邦学习。
从Machine Learning到Machine Teaching(人工智能教人类学习)
参考资料:
Making a Bird AI Expert Work for You and Me
绝艺对局:右上角绝艺老师的非常破空手段值得我们学习
本身可解释性好的机器学习算法
- kNN分类
- 逻辑回归
- 线性回归
- 决策树
- 朴素贝叶斯
传统机器学习算法的可解释性分析
- 算法自带的可视化
- 算法自带的特征权重
- Permutation Importance置换重要度
- PDP图、ICE图
- Shapley值
- Lime
深度学习的可解释性很差
卷积神经网络的可解释性分析
- 可视化卷积核、特征图
- 遮挡、缩放、平移、旋转
- 找到能使某个神经元激活的原图像素、或者小图
- 基于类激活热力图(CAM)的可视化
- 语义编码降维可视化
- 由语义编码倒推输入的原图
- 生成满足某些要求的图像(某类别预测概率最大)
卷积核、特征图可视化
卷积神经网络
每个卷积核提取不同的特征
每个卷积核对输入进行卷积,生成一个feature map
这个feature map 即提现了该卷积核从输入中提取的特种
不同的feature map显示了图像中不同的特征
浅层卷积核提取:边缘、颜色、斑块等底层像素特征
中层卷积核提取:条纹、纹路、形状等中层纹理特征
高层卷积核提取:眼睛、轮胎、文字等高层语义特征
最后的分类输出层输出最抽象的分类结果
可解释机器学习各类方法特点
被动解释
基于隐层可视化:使用可视化方法生成人类能理解的图像,解释隐层的含义
基于类激活映射:对线形图线性加权获得类激活图,解释个体的分类决策
基于敏感性分析:对输入变量施加扰动,评估特性的重要性
基于鲁棒性扰动测试:解释精心设计过的新输入对模型预测的影响程度
基于频率原理:研究频率信号的规律,解释神经网络训练过程中的偏好
主动解释
基于可解释模块:额外引入可解释的网络模块,修改原有网络结构
基于优化方法:向损失函数中添加正则化项,利用相关的优化方法进行解释
补充解释
基于信息论:将信息论领域的相关概念或术语整合到神经网络中,获得更多的信息的解释
(来源:深度学习的可解释性研究综述 李凌敏,侯梦然,陈琨,刘军民)
深度学习可解释性研究
需求
- 提高模型透明度
- 提高模型可信度
- 伦理法律的需求
定义
- 全局可解释性
- 局部可解释性
- 内置可解释性
评价指标
- 忠实度
- 准确性
- 鲁棒性
- 可理解性
典型方法
解释逻辑规则
- 基于决策树的方法
- 基于知识图谱的方法
解释决策归因
- 特征归因
- 概念归因
- 样本归因
解释内部结构表示
- 层的表示
- 神经元的表示
未来方向
- 可解释智能的构建与实现
- 建立完备的数据理论指导和改进深度学习模型表达能力、学习能力和泛化能力
(来源:深度学习可解释性研究综述 雷霞、罗雄麟)
【Datawhale可解释性机器学习笔记】预备知识学习相关推荐
- python输出字体的大小_Toby的Python笔记 | 预备知识:安装openpyxl学做电子表格
Toby的Python笔记 | 预备知识:安装openpyxl学做电子表格 Python 需要创建和读取excel表里面的数据,需要用 openpyxl 这个包,今天安装好备用. 首先,进入C命令窗口 ...
- 机器学习笔记之集成学习(四)Gradient Boosting
机器学习笔记之集成学习--Gradient Boosting 引言 回顾: Boosting \text{Boosting} Boosting算法思想与 AdaBoost \text{AdaBoost ...
- 机器学习(三)——预备知识(学习率与激活函数)
预备知识 import tensorflow as tf import numpy as np # a = tf.constant([1,3,2,2,5]) # b = tf.constant([0, ...
- [机器学习笔记] Note1--机器学习简介
阅读本文大约需要 2 分钟 本文结构: 什么是机器学习 监督学习(Supervised Learning) 非监督学习(Unsupervised Learning) 课程小结 这是学习 Andrew ...
- 机器学习笔记-多分类学习,类别不平衡,决策树
读书笔记 多分类学习 基本思想:拆解法:将多分类任务拆解为若干个二分类任务求解,先对这些问题经拆分,为拆分出的每个二分类任务训练一个分类器,测试时,对这些分类器的预测结果进行集成以获得最终的多分类结果 ...
- 数据分析之预备知识学习笔记
文章导航 1,前言 2,anaconda 2.1,模块.包和库是什么 模块(module) 包(package) 库(library) 2.1.1总结 2.2,anaconda介绍 2.3,Anaco ...
- [机器学习笔记]Note9--机器学习系统设计
继续是机器学习课程的笔记,本节课的内容主要是介绍如何设计一个机器学习系统. 首先要做什么 这节课将介绍如何设计一个机器学习系统,首先是以设计一个垃圾邮件分类器算法作为例子. 为了解决这个问题,首先要决 ...
- [机器学习笔记]Note8--机器学习应用建议
继续是机器学习课程的笔记,本节课的内容主要是一些机器学习应用的建议,包括对假设的评估,如何处理过拟合和欠拟合等. 觉得下一步做什么 到目前为止,我们已经学习了线性回归,逻辑回归以及神经网络,梯度下降等 ...
- 生成模型笔记预备知识笔记——概率分布变换
最近准备课程分享,挑了一下最近比较火的AI作画方面的文章,结果发现这个领域水挺深的,也涉及到挺多数学方面的知识,得多做一下笔记.本文参考了这篇分享,算是这篇的一个读后笔记.PaperWeekly 第4 ...
最新文章
- SQL Server 对比数据库差异
- dump文件的生成及的分析
- 在敏捷中应用测试驱动开发
- @Autowired 注释的作用和用法
- poj 1067 取石子游戏(博弈+威佐夫博奕(Wythoff Game))
- 有趣又有用的皮托定理!
- AntDesign Form表单字段校验的三种方式
- python基础代码技巧_写Python必须知道的这几个代码技巧!你会吗?
- 10分钟学会vuex
- 华为音量键只能调通话_华为手机音量键的隐藏功能,知道一个就会好用不少!...
- Android连接数据库的问题
- 计算机操作系统课后答案--郁红英版
- 拼多多关键词搜索接口,商品分类ID搜索商品列表接口,关键词搜索商品销量接口,拼多多销量API接口
- u盘写保护无法格式化的修复
- 项目集锦 | 易基因近期m6A甲基化(MeRIP-seq)研究成果
- CaffeNet简介
- “互联网+”大学生创新创业大赛概述
- CSS实现文字动画炫酷效果
- Dos窗口的打开与基本命令
- WPS JS宏示例——工作表排序