SR2CNN Zero-Shot Learning for Signal Recognition

SR2CNN:用于信号识别的零试学习

信号识别是信号处理和通信领域的一项重要而富有挑战性的任务。通常情况下,某些信号类别没有可以使用的数据来执行识别任务。因此,作为图像处理领域中广泛应用的零试学习(zero-shot learning,ZSL)对于信号识别也非常重要。不幸的是,由于难以解释的信号语义,关于这个领域的ZSL几乎没有被研究过。本文提出了一种ZSL框架,即信号识别与重构卷积神经网络(SR2CNN),以解决这种情况下的相关问题。SR2CNN通过引入交叉熵损失、中心损失和重构损失的适当组合,以及采用合适的距离度量空间,使语义特征的最小类间距离大于最大类内距离,来学习信号语义特征空间的表示。而且,由于持续的细化语义特征空间中的类中心向量,SR2CNN能够在信号检测的帮助下逐步改善他自身。

引言

如今,随着深度卷积神经网络的发展,CCN在信号识别领域已经取得了显著成果。通常,绝大多数现有的学习方法都遵循封闭集假设,也就是说,假设所有的测试类别都与培训类别相同。然而在实际生活中,新的类别经常出现,而模型却只有在现有的有限可知类下进行训练。开放集学习(测试样本可能来自不可知类)被提出部分解决这个问题。开放集识别系统的目标是拒绝未知类别的测试样本,同时保持已知类别的性能。然而,在某些情况下,学习模型不仅应该能够区分未知类和已知类,还应该能够区分不同的未知类。零试学习是解决上述问题的一种方法,并且已经运用到了图像任务中。对于图像,我们很容易提取一些特定的高级描述作为语义属性。例如,从斑马的图片中,我们可以提取以下语义属性(1)颜色:白色和黑色,(2)条纹:是,(3)大小:中等,(4)形状:马,(5)陆地:是。然而,对于真实世界的信号,由于模糊的信号语义,几乎不可能有高级别的描述,因此虽然ZSL已经被广泛运用于图像任务,但没有用于信号识别。

本文致力于学习一个不仅能区分可知类还可以区分未标注的不可知类的框架。对于这个问题,需要解决的关键问题是自动的学习信号语义属性空间的一个表示。在本文的方案中,CNN联合自动编码器去提取语义属性特征。然后使用一个适当地定义地语义度量对语义属性特征进行了很好地分类。整体结构如下图:

此外,为了建立一个自进化学习模型,当算法连续执行时,需要考虑增量学习。增量学习的目标是动态地使模型适应来自新数据的新知识,而不忘记已经学习的知识。基于增量学习,随着时间地退役获得的模型会逐渐地改善。

文章贡献

(1)首先,提出了一个基于深度CNN的零试学习框架SR2CNN用于开集信号识别。SR2CNN被训练来提取语义特征z同时保持解码器和分类器的性能。然后,语义特征z被用来区分信号类别。

(2)其次,大量的实验证明SR2CNN不仅能够鉴别可知类还可以鉴别不可知类同时逐渐改善自身。

(3)提出了一个新的数据集SIGNAL-202002.

让X,Y分别表示信号的输入空间和输出空间。集合Y被分割为K和U,分别可知类和不可知类的标签集。给定训练数据 ,任务是推断和识别属于Y的信号类别。具体来说,当我们获得输入数据 ​​​​​​​ ,提出的学习框架能够正确的预测标签y 。该学习框架与开放集学习的不同之处在于,我们不仅将x分类为K或U,而且还预测标签y∈Y。注意,Y包括已知类K和未知类U。

我们关注使用语义知识识别K和推断U的ZSL。为此,我们首先将X映射到语义空间Z,然后将语义编码映射到类标签。在数学上我们使用如下的非线性映射去描述我们的方案。H是两个函数的组合,F和P定义如下,如:

因此,我们的任务是去找到左边正确的F和P以构建一个能识别可见和不可见信号类的学习框架。

提出的方法

从整体上而言整个学习框架由下边的四个模块构成:

  1. 特征提取器(F)
  2. 分类器(C)
  3. 解码器(D)
  4. 判别(鉴别)器(P)

所提的方法主要由两个步骤组成。第一步,通过F,C和D为信号建立一个语义空间。F,C和D的结构如下图所示:

F由CNN架构搭建,将输入信号投射到潜在的语义空间表示上。C有一个全连接神经网络构成,采用隐藏的语义空间表示作为输入,并决定数据的标签。D由其它的CNN架构构建,致力于产生尽可能与输入信号相似的重构信号。

第二步,为训练的语义空间找到一个合适的距离度量,并使用该距离来区分信号类别。P被设计用来区分所有类别,包括已知和未知。

特征提取器、分类器和解码器

考虑到信号的独特性,F的输入形状应该是两行的矩形矩阵,而不是方形矩阵。在本方案中F由四个卷积层和两个全连接层构成。为了最小化Z空间中的类内变化,同时保持类间语义特征的良好分离,使用了中心损失(可以增加类内的紧凑性,由于类内不断紧凑类间距离也会随之变大)。

其中 的预测。

使用自动编码器以保留Z中有效的语义信息。解码器D被用来从Z中重构Z。它由反卷积,上池化和全连接层构成。具体来说,最大上池化保持最大池化期间的最大位置信息,然后对应位置的最大值并将其余位置置为0图3(a),类似的,平均上池化以复制的方式扩展特征映射如图3(b)。

反卷积也叫转置卷积,用于从输出中恢复输入的形状,如图3(c)所示。

除此之外,重构损失被用来评估原始信号数据和重构信号数据之间的不同:

鉴别器

鉴别器P是该框架的尾部但确是核心。它基于隐藏语义空间Z鉴别可知和不可知类。对于每一个可知类k,特征提取器F提取和计算对应的语义中心向量 ​​​​​​​如下:

集识别方法相比,SR2CNN的显著优势在于,SR2CNN可以大致区分测试集中有多少未知类,而不仅仅是将测试样本标记为未知类。

结论

在本文中,我们提出了一个ZSL框架SR2CNN,它可以成功地提取信号的精确语义特征,并区分已知类别和未知类别。SR2CNN可以在我们没有足够的训练数据的情况下很好地工作。此外,SR2CNN通常可以通过更新语义中心向量来改进自身。大量实验证明了SR2CNN的有效性。此外,我们还提供了一个新的信号数据集signal-202002,其中包括八个数字和三个模拟调制类,以供进一步研究。最后,我们想指出,由于我们经常有I/Q信号,未来研究的一个可能方向是使用复杂的神经网络来建立语义空间。

SR2CNN Zero-Shot Learning for Signal Recognition(SR2CNN:用于信号识别的零试学习)相关推荐

  1. (转)Paper list of Meta Learning/ Learning to Learn/ One Shot Learning/ Lifelong Learning

    Meta Learning/ Learning to Learn/ One Shot Learning/ Lifelong Learning 2018-08-03 19:16:56 本文转自:http ...

  2. Deep Residual Learning for Image Recognition(ResNet)论文翻译及学习笔记

    [论文翻译]:Deep Residual Learning for Image Recognition [论文来源]:Deep Residual Learning for Image Recognit ...

  3. 语音识别(ASR)论文优选:挑战ASR规模极限Scaling ASR Improves Zero and Few Shot Learning

    声明:平时看些文章做些笔记分享出来,文章中难免存在错误的地方,还望大家海涵.搜集一些资料,方便查阅学习:http://yqli.tech/page/speech.html.语音合成领域论文列表请访问h ...

  4. 图像分类经典卷积神经网络—ResNet论文翻译(中英文对照版)—Deep Residual Learning for Image Recognition(深度残差学习的图像识别)

    图像分类经典论文翻译汇总:[翻译汇总] 翻译pdf文件下载:[下载地址] 此版为中英文对照版,纯中文版请稳步:[ResNet纯中文版] Deep Residual Learning for Image ...

  5. 深度学习论文阅读图像分类篇(五):ResNet《Deep Residual Learning for Image Recognition》

    深度学习论文阅读图像分类篇(五):ResNet<Deep Residual Learning for Image Recognition> Abstract 摘要 1. Introduct ...

  6. 【论文翻译】Deep Residual Learning for Image Recognition

    [论文翻译]Deep Residual Learning for Image Recognition [论文题目]Deep Residual Learning for Image Recognitio ...

  7. 论文翻译[Deep Residual Learning for Image Recognition]

    论文来源:Deep Residual Learning for Image Recognition [翻译人]:BDML@CQUT实验室 Deep Residual Learning for Imag ...

  8. 论文精翻《Progressive Tandem Learning for Pattern Recognition With Deep Spiking Neural Networks》

    目录 0 摘要/Abstract 1 简介/Introduction 2 相关工作/Related Work 3 重新思考ANN-to-SNN的转换/Rethinking ANN-to-SNN Con ...

  9. DeepLearning | Zero Shot Learning 零样本学习(扩展内容、模型、数据集)

    之前写过一篇关于零样本学习的博客,当时写的比较浅.后来导师让我弄个ppt去给本科生做一个关于Zero Shot Learning 的报告,我重新总结了一下,添加了一些新的内容,讲课的效果应该还不错,这 ...

  10. Micro-expression recognition with supervised contrastive learning基于对比监督学习的微表情识别

    Micro-expression recognition with supervised contrastive learning基于对比监督学习的微表情识别--2022 PRL 文章链接:https ...

最新文章

  1. 人工神经网络研究的发展及特性,以前不叫人工智能
  2. Scheme来实现八皇后问题(2)
  3. HttpClient 详解一《C#高级编程(第9版)》
  4. linux存储--文件描述符以及file结构体(一)
  5. 词法分析-中文分词技术-正向最大匹配法与逆向最大匹配法
  6. springboot2.0 redis EnableCaching的配置和使用
  7. java calendar_Java Calendar complete()方法与示例
  8. 《ArcGIS Runtime SDK for Android开发笔记》——离在线一体化技术:离线矢量数据同步...
  9. Message Unable to connect to SQL Server '(local)'
  10. 2018_08_10_生活记录_关于我和这个博客的说明
  11. linux 小度wifi,树莓派2小度wifi(MT7601U)驱动
  12. 正常高、大地高、海拔高的测绘概念
  13. Spring boot的定时任务调度
  14. QT 多线程异步获取htpp信息 网络通信
  15. Linux,Centos下 Tomcat8 修改jvm内存配置的新方法
  16. 最大似然函数及其求解
  17. coreldraw 阻止联网_用防火墙禁止程序联网,隐私、更新、广告统统解决!
  18. 计算机90学时培训小结,90学时培训总结
  19. 公共事业管理概论复习题
  20. JavaScript——将json数组填充进excel表并下载保存

热门文章

  1. 高维数据建模 || 2. 线性降维 | 2.2 主成分分析的几何视角
  2. Vue 访问外链失败问题
  3. 临近下课还有10分钟时候的一些感想
  4. 2020年起重机械指挥考试总结及起重机械指挥考试平台
  5. 职场小白浅谈网络优化
  6. 2022年数模国赛 无人机定位思路
  7. Pickering Electronics最小的通孔舌簧继电器将在慕尼黑上海电子展上亮相
  8. 地震预警系统全平台开通攻略
  9. java计算机毕业设计校园服务网源代码+数据库+系统+lw文档
  10. 湖南科技学院计算机考试时间,湖南科技学院计算机系204下期考试安排表1 (1)1