人工智能黑箱子灵魂之问

  • AI的脑回路是怎样的?
  • AI如何做出决策?
  • 是否符合人类的直觉和常识
  • 如何衡量不同特征对AI预测结果的不同贡献?
  • AI什么时候work?AI什么时候不work?
  • AI有没有过拟合?泛化能力如何?
  • 会不会被黑客误导,让AI指鹿为马?
  • 如果样本的某个特征变大15,会对AI预测结果产生什么影响?
  • 如果AI误判,为什么会犯错?如何能不犯错?
  • 两个AI预测结果不同,该信哪一个?
  • 能让AI把学到的特征教给人类吗?

选择人工智能研究方向的建议

  • 尽可能通用,与其他研究方向交叉
  • 顺应主流发展趋势,长期存在且有用
  • 有高质量的数据集
  • 不过分小众,但也好发paper,没有疯狂内卷
  • 能应用到产业界垂直细分产业
  • 有商业应用价值,容易“讲故事”

(建议来自;同济子豪兄)

为什么要学可解释机器学习

  • 研究AI的脑回路,就是研究AI的本质
  • 可解释分析是机器学习和数据挖掘的通用研究方法。
  • 和所有AI方向交叉融合:数据挖掘、CV、NLP、强化学习、知识图谱、联邦学习。
  • 包括但不限于:大模型、弱监督、缺陷异常检测、细粒度分类、决策AI和强化学习、图神经网络、AI纠偏、AI4Science、Machine Teaching、对抗样本、可信计算、联邦学习。

从Machine Learning到Machine Teaching(人工智能教人类学习)

参考资料:

Making a Bird AI Expert Work for You and Me

绝艺对局:右上角绝艺老师的非常破空手段值得我们学习

本身可解释性好的机器学习算法

  • kNN分类
  • 逻辑回归
  • 线性回归
  • 决策树
  • 朴素贝叶斯

传统机器学习算法的可解释性分析

  • 算法自带的可视化
  • 算法自带的特征权重
  • Permutation Importance置换重要度
  • PDP图、ICE图
  • Shapley值
  • Lime

深度学习的可解释性很差

卷积神经网络的可解释性分析

  • 可视化卷积核、特征图
  • 遮挡、缩放、平移、旋转
  • 找到能使某个神经元激活的原图像素、或者小图
  • 基于类激活热力图(CAM)的可视化
  • 语义编码降维可视化
  • 由语义编码倒推输入的原图
  • 生成满足某些要求的图像(某类别预测概率最大)

卷积核、特征图可视化

卷积神经网络

每个卷积核提取不同的特征
每个卷积核对输入进行卷积,生成一个feature map
这个feature map 即提现了该卷积核从输入中提取的特种
不同的feature map显示了图像中不同的特征

浅层卷积核提取:边缘、颜色、斑块等底层像素特征
中层卷积核提取:条纹、纹路、形状等中层纹理特征
高层卷积核提取:眼睛、轮胎、文字等高层语义特征
最后的分类输出层输出最抽象的分类结果

可解释机器学习各类方法特点

被动解释

基于隐层可视化:使用可视化方法生成人类能理解的图像,解释隐层的含义
基于类激活映射:对线形图线性加权获得类激活图,解释个体的分类决策
基于敏感性分析:对输入变量施加扰动,评估特性的重要性
基于鲁棒性扰动测试:解释精心设计过的新输入对模型预测的影响程度
基于频率原理:研究频率信号的规律,解释神经网络训练过程中的偏好

主动解释

基于可解释模块:额外引入可解释的网络模块,修改原有网络结构
基于优化方法:向损失函数中添加正则化项,利用相关的优化方法进行解释

补充解释

基于信息论:将信息论领域的相关概念或术语整合到神经网络中,获得更多的信息的解释

(来源:深度学习的可解释性研究综述 李凌敏,侯梦然,陈琨,刘军民)

深度学习可解释性研究

需求

  • 提高模型透明度
  • 提高模型可信度
  • 伦理法律的需求

定义

  • 全局可解释性
  • 局部可解释性
  • 内置可解释性

评价指标

  • 忠实度
  • 准确性
  • 鲁棒性
  • 可理解性

典型方法

解释逻辑规则

  • 基于决策树的方法
  • 基于知识图谱的方法

解释决策归因

  • 特征归因
  • 概念归因
  • 样本归因

解释内部结构表示

  • 层的表示
  • 神经元的表示

未来方向

  • 可解释智能的构建与实现
  • 建立完备的数据理论指导和改进深度学习模型表达能力、学习能力和泛化能力
    (来源:深度学习可解释性研究综述 雷霞、罗雄麟)

【Datawhale可解释性机器学习笔记】预备知识学习相关推荐

  1. python输出字体的大小_Toby的Python笔记 | 预备知识:安装openpyxl学做电子表格

    Toby的Python笔记 | 预备知识:安装openpyxl学做电子表格 Python 需要创建和读取excel表里面的数据,需要用 openpyxl 这个包,今天安装好备用. 首先,进入C命令窗口 ...

  2. 机器学习笔记之集成学习(四)Gradient Boosting

    机器学习笔记之集成学习--Gradient Boosting 引言 回顾: Boosting \text{Boosting} Boosting算法思想与 AdaBoost \text{AdaBoost ...

  3. 机器学习(三)——预备知识(学习率与激活函数)

    预备知识 import tensorflow as tf import numpy as np # a = tf.constant([1,3,2,2,5]) # b = tf.constant([0, ...

  4. [机器学习笔记] Note1--机器学习简介

    阅读本文大约需要 2 分钟 本文结构: 什么是机器学习 监督学习(Supervised Learning) 非监督学习(Unsupervised Learning) 课程小结 这是学习 Andrew ...

  5. 机器学习笔记-多分类学习,类别不平衡,决策树

    读书笔记 多分类学习 基本思想:拆解法:将多分类任务拆解为若干个二分类任务求解,先对这些问题经拆分,为拆分出的每个二分类任务训练一个分类器,测试时,对这些分类器的预测结果进行集成以获得最终的多分类结果 ...

  6. 数据分析之预备知识学习笔记

    文章导航 1,前言 2,anaconda 2.1,模块.包和库是什么 模块(module) 包(package) 库(library) 2.1.1总结 2.2,anaconda介绍 2.3,Anaco ...

  7. [机器学习笔记]Note9--机器学习系统设计

    继续是机器学习课程的笔记,本节课的内容主要是介绍如何设计一个机器学习系统. 首先要做什么 这节课将介绍如何设计一个机器学习系统,首先是以设计一个垃圾邮件分类器算法作为例子. 为了解决这个问题,首先要决 ...

  8. [机器学习笔记]Note8--机器学习应用建议

    继续是机器学习课程的笔记,本节课的内容主要是一些机器学习应用的建议,包括对假设的评估,如何处理过拟合和欠拟合等. 觉得下一步做什么 到目前为止,我们已经学习了线性回归,逻辑回归以及神经网络,梯度下降等 ...

  9. 生成模型笔记预备知识笔记——概率分布变换

    最近准备课程分享,挑了一下最近比较火的AI作画方面的文章,结果发现这个领域水挺深的,也涉及到挺多数学方面的知识,得多做一下笔记.本文参考了这篇分享,算是这篇的一个读后笔记.PaperWeekly 第4 ...

最新文章

  1. SQL Server 对比数据库差异
  2. dump文件的生成及的分析
  3. 在敏捷中应用测试驱动开发
  4. @Autowired 注释的作用和用法
  5. poj 1067 取石子游戏(博弈+威佐夫博奕(Wythoff Game))
  6. 有趣又有用的皮托定理!
  7. AntDesign Form表单字段校验的三种方式
  8. python基础代码技巧_写Python必须知道的这几个代码技巧!你会吗?
  9. 10分钟学会vuex
  10. 华为音量键只能调通话_华为手机音量键的隐藏功能,知道一个就会好用不少!...
  11. Android连接数据库的问题
  12. 计算机操作系统课后答案--郁红英版
  13. 拼多多关键词搜索接口,商品分类ID搜索商品列表接口,关键词搜索商品销量接口,拼多多销量API接口
  14. u盘写保护无法格式化的修复
  15. 项目集锦 | 易基因近期m6A甲基化(MeRIP-seq)研究成果
  16. CaffeNet简介
  17. “互联网+”大学生创新创业大赛概述
  18. CSS实现文字动画炫酷效果
  19. Dos窗口的打开与基本命令
  20. WPS JS宏示例——工作表排序

热门文章

  1. C - 一只小蜜蜂...
  2. 计算机原理eprom,EPROM
  3. 几何不变矩 Hu 矩
  4. 时尚文化概论结课论文
  5. Linux添加Additional Perl modules
  6. 浅谈共享软件如何不被暴力蹂躏
  7. 类似YY 9158网页版多人语音视频聊天室远程教学系统源码
  8. 关于写论文的格式要点
  9. BGP高防服务器是什么?要怎么选?
  10. java山寨qq账号密码验证_Java实战-山寨QQ