论文题目: TabNet: Attentive Interpretable Tabular Learning
论文地址: https://arxiv.org/abs/1908.07442
论文发表于: arXiv 2019

论文大体内容:
本文主要提出了TabNet模型,能够高效地在tabular数据上完成分类/回归的任务,且具可解释性。本文提出的模型是用DNN的方式获得树模型的可解释性,且超越树模型的效果。

Motivation:
tabular数据一般都使用树模型去处理,怎么用DNN去实现树模型的效果,并也能获得模型的可解释性,是打破DNN黑盒子的一个方法。

Contribution:
TabNet有以下特性:
①直接使用raw feature,不需要手动feature selection,能够end2end生成;
②sequential attention去进行feature selection,而且是instance-wise(每个样本不一样);
③tabnet在分类和回归任务比其它模型效果好,且具可解释性,
包括每个特征当前的特征重要性(局部可解释性),每个特征对label的影响(全局可解释性)
④是第一个用于tabular数据的自监督学习模型;

1. DNN模型实现树模型的功能
①通过mask(feature selection);
②FC+ReLU,再加起来,最后过一层softmax,则可以得到如右图的分界;

2. TabNet的整体框架

3. 输入的feature:f ∈ R^(B*D),B是batch_size,D的feature的维度;

4. Feature transformer:包含4层,其中2层是共享的,2层是每一步独立的;

5. split:产出2个信息:d[i]和a[i],d[i]是用于输出预测结果的,a[i]是用于给后续的attention做输入的;

6. Attention transformer:产出M[i],代表Mask;

7. 最终产出结果

8. 自监督学习的做法:(类似用word2vec产出embedding,再进行找相似)

9. 可解释性的计算(特征重要性)
ηb衡量第b个样本输出的重要性,M衡量特征重要性;

实验
本文做的实验比较多,主要关注下面几个点:
①效果与其它模型比,是否更好;
②特征选择是否能实现;
③在自监督学习上的表现;

10. Dataset
人工数据集;
Poker Hand;
Higgs Boson;
KDD数据集;
Adult Census Income;
等等;

11. Baseline
Lasso;
xgboost;
lightgbm;
catboost;
MLP;
等等;

12. Metric
ACC;
MSE;
AUC;
等等;

13. 实验结果


参考资料: 
[1] https://github.com/dreamquark-ai/tabnet
[2] https://github.com/google-research/google-research/tree/master/tabnet
[3] https://zhuanlan.zhihu.com/p/126755362

以上均为个人见解,因本人水平有限,如发现有所错漏,敬请指出,谢谢!

#Paper Reading# TabNet: Attentive Interpretable Tabular Learning相关推荐

  1. 论文解读9——TabNet: Attentive Interpretable Tabular Learning

    目录 1.文章贡献 2.决策流型 3.TabNet模型结构 好久没有更读论文的总结了,中途有几篇读了还没来得及记录,开学杂事一多竟然已经过了一个多月了--好吧其实就是自己懒,时间挤挤还是有的. 下面就 ...

  2. Paper reading (十八):Machine learning applications in genetics and genomics

    论文题目:Machine learning applications in genetics and genomics scholar 引用:528 页数:12 发表时间:2015.05 发表刊物:n ...

  3. 【Paper Reading FedBCD: A Communication-Efficient Collaborative Learning Framework for DF

    FedBCD: A Communication-Efficient Collaborative Learning Framework for Distributed Features 原文来源:[TS ...

  4. Paper Reading 《SimCSE》

    Paper Reading: SimCSE SimCSE: Simple Contrastive Learning of Sentence Embeddings 尚未发表.Github. Paper. ...

  5. #Paper reading#DeepInf: Social Influence Prediction with Deep Learning

    #Paper reading# DeepInf: Social Influence Prediction with Deep Learning 设计了一个端到端的框架DeepInf,研究用户层面的社会 ...

  6. cvpr2019/cvpr2018/cvpr2017(Papers/Codes/Project/Paper reading)

    cvpr2019/cvpr2018/cvpr2017(Papers/Codes/Project/Paper reading) Source:https://mp.weixin.qq.com/s/SmS ...

  7. [paper reading] RetinaNet

    [paper reading] RetinaNet GitHub:Notes of Classic Detection Papers 本来想放到GitHub的,结果GitHub不支持公式. 没办法只能 ...

  8. [paper reading] ResNet

    [paper reading] ResNet GitHub:Notes of Classic Detection Papers 本来想放到GitHub的,结果GitHub不支持公式. 没办法只能放到C ...

  9. [paper reading] 译 + 注 :如何阅读 Research Papers(Andrew Ng)

    [paper reading] 译 + 注 :如何阅读 Research Papers(Andrew Ng) 本文基于吴恩达老师 (Andrew Ng) 在 Stanford Deep Learnin ...

最新文章

  1. 【CTS】几个serialno失败项
  2. Android系统源码编译最重要的一步
  3. 用keil仿真程序,出现 EVALUATION MODE Running with Code Size Limit:2K
  4. 2018.5.12说说反射的用途及实现------要再花费时间加强理解
  5. 在unity调用WebService的接口方法
  6. QT的QThread类的使用
  7. C++main函数的参数介绍以及如何在main函数前执行一段代码
  8. 泰顺县人事劳动社会保障局灾备集成项目招标
  9. 从雅迪赞助FIFA世界杯透视体育营销趋势
  10. 中文编程专栏目录, 初衷和希冀
  11. 基于matlab的车牌识别系统设计
  12. Java前方交会后方交会编程_摄影测量后方交会、前方交会程序
  13. 利普希茨连续(Lipschitz continuity)和利普希茨常数(Lipschitz constant)
  14. vs无法打开源文件_南美预选:乌拉圭vs巴西,双方核心都无法上场,谁来打开胜利之门?...
  15. windows云服务器价格_windows云服务器安装(微软云服务器价格)
  16. 显卡系列和种类你了解多少?AMD、NVIDIA显卡盘点
  17. [256个管理学理论]004.鲶鱼效应(Catfish Effect)
  18. jacob java excel_使用 Jacob 操作Excel、Word文件
  19. Eden和Survivor
  20. 知道吗,你和高级工程师差距巨大

热门文章

  1. [Shell]尚硅谷大数据技术之Shell--笔记(3)
  2. MAC M1安装docker并拉取mysql镜像
  3. matplotlib的学习4-设置坐标轴
  4. 超过 25 个华丽的 Web 日历组件【多图慎入】
  5. 在VC 6.0里Win32 Application和Win32 console Application的区别
  6. 2022考研真题+汤家凤网课视频。祝2022考研朋友顺利上岸!
  7. 分布式定时任务调度中心
  8. Linux内核移植 part3:sdmmc驱动
  9. Node.js快速入门
  10. vba单元格颜色设置