Self-Paced Network Representation for Few-Shot Rare Category Characterization

  • ABSTRACT
  • INTRODUCTION
  • RELATED WORK
    • Rare Category Analysis
    • Network Representation
    • Curriculum Learning
  • PROBLEM DEFINITION
    • 问题1 Rare Category Embedding Representation (RCE)
    • 问题2 Rare Category Characterization (RCC)
  • PROPOSED MODEL
    • A Generic Joint Learning Framework

ABSTRACT

  • 稀有类别可以使用在:在线交易网络中的金融欺诈检测,社交网络中的新兴趋势检测,计算机网络中的网络入侵检测,故障检测。
  • 目的是在有限的标签信息中,学习到稀有类的表示
  • 能够在embedding空间中将稀有类别和其他类表示分开
  • 建立了一个方法:self-paced framework( SPARC)来学习稀有类别网络表示

INTRODUCTION

  • 稀有类别的识别和表示是困难的:由于稀有类别与其他类不好区分。比如financial fraud detection中fraudulent people会模仿正常用户;spam detection中垃圾邮件会像一个正常的邮件
  • 由于稀有类别不好区分,因此给这个类别打标签很昂贵
  • 稀有分类:
    (1) highly skewed (2) non-separable and (3) sparsely labeled
  • 论文讨论的问题:
    (1)当少数类与多数类不可分离时,如何学习一个面向显著稀有类的嵌入表示以便更好地刻画它们
    (2)如何准确地描述稀缺信息在标签信息稀缺性方面的表现
  • 当前存在的图embedding的方法对稀有类不能很好的表达:如node2vec等。后来提出的方法也有问题。。
  • SPARC可以预测稀有类和邻居上下文
  • 论文做到:
    (1)Embedding
    (2)Characterization
    使用了self-paced learning

RELATED WORK

Rare Category Analysis

Network Representation

各种embedding

Curriculum Learning

model is gradually trained from easy aspects of a task to the complex ones
上一篇self-pace learning

PROBLEM DEFINITION

问题1 Rare Category Embedding Representation (RCE)

  • input
  1. an attributed network G = (V , E, X ) v定点e边x定点类别
  2. label x1,…,xl
  3. embedding的维度d
  • output
    关照到rare lable 的顶点的d维向量

问题2 Rare Category Characterization (RCC)

  • input
  1. an attributed network G = (V , E, X ) v定点e边x定点类别
  2. label x1,…,xl
  • output
    a list of predicted rare category examples.预测的稀有类的example

由于问题12有关,因此论文决定联合解决问题12.

PROPOSED MODEL

SPARC 既能够进行graph embedding,又能够预测rare category examples

A Generic Joint Learning Framework

  1. 对于只有两个类的图,一个majority class,一个minority class。
    generic rare category analysis framework 作为一个优化方程:

(代价敏感学习cost sensitive learning:
当不同的分类错误会导致不同的惩罚力度时如何训练分类器。
例如风控模型,将一个坏用户分类为好用户所造成的损失远远大于将一个好用户分类来坏用户的损失,因此在这种情况下要尽量避免将坏用户分类为好用户,可以在算法学习的时候,为坏用户样本设置更高的学习权重,从而让算法更加专注于坏用户的分类情况,提高对坏用户样本分类的查全率,但是也会将很多好用户分类为坏用户,降低坏用户分类的查准率。)

objective function:

方法分三个步骤:

  • step 1
    基于当前预测模型,将伪标签分配给潜在的稀有类别实例。

  • step 2
    第二阶段是本文提出的SPARC模型的关键步骤,它联合选择面向稀有类别的图上下文和可靠预测来训练RCE和RCC模型。
    RCE DNN被训练以学习RCC问题的突出嵌入空间。

  • step 3
    第三阶段包括两个深层神经网络(DNN)的构建,包括RCE DNN(上层)和RCC DNN(下层)

其实,对于目标公式,可以分成三部分:

  • 第一部分 Lrcc
    打标签,对未知标签的顶点打标签

    Ls是已有标签的顶点分错类的概率,要尽可能的小。
    后面的是将顶点的标签分成min类(1)的概率,采用的式子是自步学习的式子,vi是是否选择此样本(0不选择,1选择),之前有介绍过。
    对于pr概率公式:

    也就是在当前feature vector xi和顶点embedding vector ei下属于yi的概率,其中hk是k层隐藏层,特征向量和顶点嵌入性向量点乘,越大表示此点越贴近这个feature。
    对于这部分式子,在学习的时候也就是之前网络中的RCC部分,对于学习时的梯度,关于vi求导后:

    我们想让值往小了发展,也就是往梯度负发展,也就是求导后小于0,我们会选择此样本来进行学习,也就是:

    倒数小于0,之后vi=1选择此样本,反之不选择。
  • 第二部分 Lrce

    这一部分是嵌入成向量,采用的方法是自步学习,vi是是否选择此样本(0不选择,1选择),第一个式子是cross entropy,含有正负样本,其中的gamma对于证样本是1,负样本是-1。
    对于学习的时候是否选择此样本,道理同上:
  • 第三部分 Lco
    这部分是对两个vi的一种约束。

图计算论文笔记--SPARC: Self-Paced Network Representation for Few-Shot Rare Category Characterization相关推荐

  1. 最新图神经网络论文笔记汇总(附pdf下载)

    点击上方,选择星标或置顶,不定期资源大放送! 阅读大概需要15分钟 Follow小博主,每天更新前沿干货 [导读]近年来,图神经网络变得非常火热,每年顶会在该领域内都会出现大量的研究论文,本文为大家提 ...

  2. 【论文翻译 IJCAI-20】Heterogeneous Network Representation Learning 异构网络表示学习

    文章目录 摘要 1 引言 2 异构网络挖掘 3 异构网络表示 3.1 异构网络嵌入 3.2 异构图神经网络 3.3 知识图谱与属性网络 3.4 应用 4 挑战.方向和开源数据 4.1 未来方向 避免设 ...

  3. 【论文阅读】Deep Cocktail Network: Multi-source Unsupervised Domain Adaptation with Category Shift

    Deep Cocktail Network: Multi-source Unsupervised Domain Adaptation with Category Shift SUMMARY@ 2020 ...

  4. 论文笔记004-《Knowledge Graph Alignment Network with Gated Multi-hop Neighborhood Aggregation》

    更多博客可以关注MyBlog,欢迎大家一起学习交流! 1. 简介 题目:<Knowledge Graph Alignment Network with Gated Multi-hop Neigh ...

  5. [论文笔记]SwinSUNet: Pure Transformer Network for Remote Sensing Image Change Detection

    1 论文标题 标题: SwinSUNet: Pure Transformer Network for Remote Sensing Image Change Detection 作者: Cui Zha ...

  6. 【论文笔记】Multi-Interactive Attention Network for Fine-grained Feature Learning in CTR Prediction

    <Multi-Interactive Attention Network for Fine-grained Feature Learning in CTR Prediction>论文学习 ...

  7. 【论文笔记】Multi-Content Complementation Network for Salient Object Detection in Optical RSI

    论文 论文:Multi-Content Complementation Network for Salient Object Detection in Optical Remote Sensing I ...

  8. 论文笔记 Multiple Instance Detection Network with Online Instance Classifier Refinement - CVPR 2017

    Multiple Instance Detection Network with Online Instance Classifier Refinement 华中科大Peng Tang, Xingga ...

  9. metis 多线程图划分论文笔记

    多线程图划分 目的 利用多线程来完成图划分,从而达到提高效率的作用. 定义 balance: balance 是用来衡量 k 划分有多么的平等的. balance 定义为 k * max_i{η(V_ ...

  10. 论文笔记:Contrastive Adaptation Network for Unsupervised Domain Adaptation

    1. 任务设置 U n s u p e r v i s e d D o m a i n A d a p t a t i o n f o r I m a g e C l a s s i f i c a ...

最新文章

  1. 基于现有工程解读stm32的工程文件
  2. C#——《C#语言程序设计》实验报告——继承与多态——电视和电灯委托
  3. html代码常用软件,HTML代码实际应用讲解
  4. 仿苹果手机闹钟_原来iPhone闹钟这么牛!用6年苹果今天才发现,以前不懂一直想删...
  5. 计算机的社会应用PPT,《电子计算机的发展与应用》ppt说课稿信息技术七上.ppt...
  6. 地理信息革命Geospatial Revolution
  7. linux:记录一次 处理tomcat启动卡死无报错现象的曲折过程
  8. unity3d发布linux版本_密码管理器 1Password 发布第一个 Linux 测试版本
  9. JavaWeb【Tomcat设置编码】
  10. php opendir 相对路径,我是wamp环境,怎么样让php的opendir函数可以接受相对路径?...
  11. MSP430单片机学习视频
  12. [DeFRCN] Decouple Faster R-CNN for Few-Shot Object Detection(ICCV 2021)
  13. java多线程及创建线程
  14. mtk使用android开关机动画,android MTK修改开关机动画
  15. HTML table表格 固定表头 tbody加滚动条
  16. 无法解析大于号和小于号
  17. 简明GISer Python学习指南
  18. cod16与战网服务器连接中断,《使命召唤16》无法连接服务器怎么解决 服务器连接解决攻略...
  19. 自考计算机专业实践报不了名,2014年9月北京自考计算机及应用专业实践课程网报通知...
  20. 基于Python的新闻聚合网站设计与实现

热门文章

  1. 1807521-02-3,PEP azide,PEP叠氮化物其中叠氮基发生点击反应
  2. 云大计算机专业基础综合,2020云南大学计算机专业课改考408
  3. hashcat的使用及相关
  4. STM32 DFU下载与 DFU生成工具
  5. mysql常用知识点
  6. Prometheus安装配置及其相关组件的应用
  7. C++学习记录3:定义一个矩形类Rectangle
  8. ubuntu中ping停不下来的解决
  9. Crashing Balloon
  10. python李白买酒_李白买酒的数学问题