PIAFusion: A progressive infrared and visible image fusion network based on illumination aware

本文提出了一种基于光照感知的渐进式图像融合网络PIAFusion,自适应地保持显著目标的亮度分布和背景的纹理信息。具体而言,我们设计了一个光照感知子网络来估计光照分布并计算光照概率。此外,利用光照概率构造光照感知损失,指导融合网络的训练。跨模态差分感知融合模块和中间融合策略在光照感知损失约束下,充分融合了公共信息和互补信息。此外,还建立了一个新的红外与可见光图像融合基准数据集,发布多光谱道路场景,以支持网络训练和综合评估。

介绍

(对于红外和可见光的有一些基本描述不在赘述)

提出了一种基于光照感知的渐进式红外与可见光图像融合框架PIAFusion,并发布了一个用于红外与可见光图像融合的大型基准数据集。首先,我们从现有的MFNet数据集中收集大量红外和可见光图像对,该数据集是为多模态图像语义分割拍摄的。MFNet数据集包含大量低对比度和低信噪比的红外图像以及一些未对准的图像对。因此,我们对红外图像进行锐化和增强,并去除未对齐的图像对。随后,我们设计了一个光照感知子网络来评估光照条件。更具体地,预先训练的照明感知子网络计算当前场景是白天还是夜晚的概率。然后,利用这些概率构造光照感知损失,用于指导融合网络的训练。最后,采用一个包含跨模态差分感知融合(cross-modality
differential aware fusion (CMDAF))模块的渐进式特征提取器,充分提取和融合多模态图像中的互补信息。然后,通过半融合方式融合互补特征和共同特征,图像重建器将融合后的特征变换到融合后的图像域。在光照感知损失的指导下,该融合框架能够根据光照条件自适应地融合特征目标和纹理细节等重要信息。此外,CMDAF模块和半融合策略允许我们的网络在各个阶段融合共同和互补的信息。因此,我们的融合图像可以完全保持纹理,同时强调突出的目标,无论光照条件。

贡献

1)提出了一种基于光照引导的红外与可见光图像融合框架,该框架通过感知光照情况,全天候融合源图像的有意义信息。
2)我们将跨模态差分感知融合模块与中间融合策略相结合,以整合各个阶段的互补信息和共同信息。
3)在MFNet数据集的基础上,构建了一个新的基准数据集,称为多光谱道路场景(Multi-Spectral Road Scenarios (MSRS)),用于红外和可见光图像融合的训练和评估。

相关工作

(红外和可见光的融合方法不在赘述)

Illumination aware-based vision applications

事实上,一些实际的计算机视觉应用在建模时已经考虑了照明因素。Wang等人提出了一种全局光照感知和细节保持网络(GLADNet)用于弱光图像增强。GLADNet首先计算低光照图像的全局光照估计,然后根据估计调整光照,并使用与原始图像的级联来增强细节。此外,Sakkos等人开发了一种三重多任务生成对抗网络,将具有不同光照的特征集成到分割分支中,极大地提高了前景分割的性能。此外,许多研究人员探索了利用光照信息来提高多光谱行人检测性能的可行性。例如,Li等人提出了一种光照感知更快的R-CNN,以通过在光照感知网络的输出上定义的门函数来自适应地融合红外和可见光子网络。巧合的是,Guan等人提出了一种基于光照感知行人检测和语义分割的多光谱行人检测框架。他们利用一种新颖的光照感知加权机制来描述光照条件,并将光照信息集成到双流CNN中,以获得不同光照条件下的人体相关特征。此外,MBNet促进了优化过程,并以更灵活和平衡的方式改善了探测器的性能。特别地,光照感知特征对准模块用于根据光照条件自适应地选择互补信息。
本文提出一种基于光照感知的渐进式红外与可见光融合框架,以消除光照不平衡问题。更具体地说,我们首先开发一个光照感知子网络来估计光照条件。然后,利用光照概率构造光照感知损失。最后,在光照感知损失的指导下,精细的渐进网络自适应地集成红外和可见光图像的有意义信息。

方法

Problem analysis

给定一幅红外图像Iir和一幅可见光图像Ivi,通过特征提取、融合和重构可以生成融合图像If。为了提高融合性能,我们设计了一个光照感知的损失来约束上述三个步骤。渐进式照明引导的红外和可见光图像融合网络如图3所示。

考虑到光照不平衡对信息分布的影响,我们设计了一个光照感知子网络来估计可见光图像的光照。给定一个可见图像Ivi,光照感知过程定义为:

其中NIA表示照明感知子网络,Pd和Pn分别表示图像属于白天和夜晚的概率。值得一提的是,Pd和Pn是非负标量。由于白天可见光图像中的大部分信息都集中在可见光图像中,而夜间红外图像中包含更多有意义的信息,因此光照概率从侧面反映了源图像中信息的丰富程度。因此,我们利用光照概率来计算光照感知权重,该权重通过光照分配机制来表示源图像的贡献。为了简化计算,我们的照明分配机制采用如下定义的简单归一化函数:

此外,我们还设计了一个渐进式融合网络,将互补信息和共同信息完全融合。更具体地,我们首先应用特征编码器EF从红外和可见光图像中提取深度特征,其可以表示为:
此外,我们提出一个跨模态差异感知融合(CMDAF)模块来补偿差异信息。特别地, F i F^i Fiir和 F i F^i Fivi可以用公共部分和互补部分来表示,如下所示:
其中公共部分表示公共特征,而互补部分反映不同模态的互补特征
Eq.(4)说明了差分分解的原理,它类似于差分放大电路。CMDAF模块的核心思想是将互补信息与渠道权重充分融合。因此,CMDAF模块可精确定义为:
Eq.(5)全局平均汇集将互补特征压缩到向量中。然后,通过Sigmoid函数将该向量归一化为[0,1]以生成通道权重。
另外,本文采用半融合的方式,将红外和可见光图像的共同和互补特征完全融合,连接。中途融合策略表示如下:

最后,通过图像重建器RI从融合特征Ff恢复融合图像If,其表示为Eq.(7):

Loss function

Loss function ofprogressive fusion network

为了促进渐进式融合框架根据光照条件自适应地融合有意义的信息,我们创新性地提出了光照感知损失。光照感知损耗Lillum精确定义如下:

强度损失在像素级测量融合图像和源图像之间的差异。因此,我们将红外和可见光图像的强度损失定义为:

H和W输入图像的高度和宽度,分别为||⋅||1代表L1-norm。事实上,融合图像的强度分布应符合不同源图像根据照明情况。因此,我们使用illumination-aware权重,即Wir和Wvi调整强度约束的融合图像。
光照损失驱动渐进融合网络基于光照条件动态地保存来自源图像的强度信息,然而其并不维持融合图像的最佳强度分布。为此,我们进一步引入辅助强度损失,表示为:
此外,我们期望融合后的图像能在保持最佳亮度分布的同时,保留丰富的纹理细节。基于大量的实验,我们发现的最佳纹理融合图像可以表示为红外和可见光图像纹理的最大聚合。因此,引入纹理损失以迫使融合图像包含更多的纹理信息,其定义如下:
最后,渐进融合网络的全目标函数是光照损失、辅助强度损失和纹理损失的加权,表示为:
实验结果表明,该渐进融合网络能够根据光照场景的变化,在光照损失和辅助亮度损失的指导下,动态地保持最优的亮度分布。并在纹理损失的指导下获得理想的纹理细节。因此,融合网络可以全天候地融合来自红外和可见光图像的有意义的信息。

Loss function of illumination-aware sub-network

在我们的方法中,融合性能严重依赖于光照感知子网络的准确性。光照感知网络本质上是一个分类器,它计算图像属于白天和夜间的概率。因此,我们使用交叉熵损失LIAN来约束光照感知子网络的训练过程,其表示如下:

Network architecture

Progressive fusion network architecture

如图3所示,我们采用基于端到端CNN的框架作为我们的主干,我们的渐进网络由特征提取器和图像重建器组成。
有五个卷积层特征提取器,旨在充分提取互补和共同的特征。首先,1×1卷积层的目的是减少红外和可见图像模态区别。因此,我们的火车第一层分别为红外和可见图像。之后,四个卷积层共享重量用来提取红外和可见图像的深度特性。值得注意的是,第二、第三和第四层的输出之后是CMDAF模块,以交换模态互补特征。CMDAF模块使我们的网络能够以渐进的方式在特征提取阶段集成互补信息。因此,我们的特征提取器可以完整地提取红外和可见光图像的共同和互补特征。表1中给出了特征提取器中所有卷积层的更多细节,例如内核大小、输出通道和激活函数。
除第一层外,所有卷积层的核大小均为3。特征提取器的所有层都使用LeakyRelu作为激活函数。
随后,从红外和可见光图像中提取的深度特征被连接起来,作为图像重建器的输入。图像重建器包含5个卷积层,负责充分整合公共信息和互补信息,生成融合图像。图像重建器的详细配置示于表1中。除最后一层的核大小为1 × 1外,其余各层的核大小均为3 × 3。此外,图像重建器在图像重建过程中逐渐减少特征图的通道数。图像重建器中除最后一层卷积层的激活函数为Tanh外,其余卷积层均采用Leaky Relu作为激活函数。在图像融合过程中,信息丢失是一个灾难性的问题。因此,在渐进融合网络的所有卷积层中,填充被设置为相同,并且除了第一层和最后一层之外,跨距被设置为1。因此,我们的网络没有引入任何下采样,并且融合图像的大小与源图像一致。

Illumination-aware sub-network architecture

光照感知子网络以场景中的可见光图像为输入,以光照概率为输出,对场景中的光照分布进行估计。图4中示出了光照感知子网的体系结构。

它由四个卷积层、一个全局平均池和两个全连接层组成。跨距设置为2的4 × 4卷积层压缩空间信息并提取光照信息。所有卷积层采用Leaky Relu作为激活函数,并将填充设置为相同。然后,利用全局平均池操作来整合光照信息。最后,两个完全连接的层根据照明信息计算光照概率。

【光照感知子场:差分感知融合模块与中间融合策略相结合】相关推荐

  1. 自动驾驶 Apollo 源码分析系列,感知篇(八):感知融合代码的基本流程

    说起自动驾驶感知系统,大家都会谈论到感知融合,这涉及到不同传感器数据在时间.空间的对齐和融合,最终的结果将提升自动驾驶系统的感知能力,因为我们都知道单一的传感器都是有缺陷的.本篇文章梳理 Apollo ...

  2. 新态势感知系列(1):从态势感知到全方位态势感知

    新态势感知系列(1):从态势感知到全方位态势感知 Last Modified @2017/12/2 1      引言 随着2016年的419讲话中提到要"全天候全方位感知网络安全态势&qu ...

  3. 神经网络入门回顾(感知器、多层感知器)

    神经网络属于"联结主义",和统计机器学习的理论基础区别还是很不一样. 以我自己的理解,统计机器学习的理论基于统计学,理论厚度足够强,让人有足够的安全感:而神经网络的理论更侧重于代数 ...

  4. MP模型、单层感知器、多层感知器的理解

    神经网络基础 序言 MP模型 1.逻辑与: 2.逻辑或: 3.逻辑异或: 单层感知器 多层感知器(BP) 序言 关于神经网络的内容已经学习了很多,也发现了一些问题,而这些问题是因为基础不牢靠引起的,所 ...

  5. 利用U-Net上下文融合模块实现高效的手掌线分割

    摘要 世界上许多文化都相信看手相可以用来预测一个人未来的生活.手相学使用的是手的特征,比如手掌的纹路,手的形状,或者指尖的位置.然而,目前对掌纹检测的研究还比较少,很多人采用了传统的图像处理技术.在大 ...

  6. 压缩感知算法matlab,压缩感知算法matlab

    MATLAB代码如下: 压缩感知仿真实例 压缩感知仿真实例在MATLAB R2001b中的计算结果如下: 原图像 采样率0.7 采样率0.5 采样率0.3 压缩感知仿真实例采用均方误差...... M ...

  7. 特征级融合_多传感器融合理论

    多传感器融合理论 多传感器信息融合(Multi-sensor Information Fusion,MSIF),就是利用计算机技术将来自多传感器或多源的信息和数据,在一定的准则下加以自动分析和综合,以 ...

  8. 北京超融合服务器虚拟化软件,选择超融合一体机还是超融合纯软件?

    原标题:选择超融合一体机还是超融合纯软件? 超融合这两年发展如火如荼,在软件定义存储SDS的推动下,超融合架构正在引领一场巨大的变革,成为软件定义数据中心SDDC的未来技术发展趋势. 超融合架构的优势 ...

  9. 计算机技术中的图像融合,多传感器图像融合技术的应用及发展趋势

    彭硕玲 摘  要:多传感器图像融合技术是将多个传感器在相同时间下所取得的有关某个实际场景的图像或者相应的序列信息进行综合,形成一个全新的有关该场景的阐述,而这个阐述无法利用单一传感器来获取.通过将多个 ...

最新文章

  1. plotplayer声道设置原声
  2. 在WIN7系统的笔记本上建立WIFI热点
  3. php面试心得,php面试题的总结
  4. 使用djcproxy创建代理对象
  5. Nashorn如何在新层面上影响API的发展
  6. vue隐藏浏览器_一分钟学会Vue的条件渲染和列表渲染
  7. 【VMCloud云平台】SCVMM配置(四)创建模板机准备
  8. 华为云OCR文字识别 免费在线体验!
  9. MySQL基础教程4-SQL基础概念
  10. Delphi中ComPort通信中的数据处理
  11. android锁屏界面布局修改,android 修改锁屏界面
  12. 网易的java微专业_网易微专业Java高级架构师
  13. java workflow 教程_建议收藏,从零开始创建一个Activiti工作流,手把手教你完成...
  14. 量子计算机不能解决的问题,量子计算机破产问题传统计算机无法解决
  15. 使用SPFx一行代码实现Office 365文档库Modern UI中批量签出文档
  16. 题目:输入一个整数a,其个位为第一位,十位为第二位,依次类推,计算a的偶数位的和奇数位的和。
  17. c语言 猜数字小游戏
  18. 一元导数与多元求导数总结
  19. css预处理全部知识点一文讲清楚
  20. ai突破性技术_人工智能还没有突破

热门文章

  1. 腹肌的最有效的健身方法---空中蹬车
  2. pandas读取excel带汉字的列头,Pandas读取excel与中文文件名
  3. 挂耳式耳机品牌排行榜,五款目前排行靠前的耳机分享
  4. java语言如何求平方根
  5. 计算机基础长文档的排版,长文档的排版(说课)重要.ppt
  6. 通过3SAT证明支配集是NPC问题
  7. GitHub:30%的新增代码出自AI工具Copilot之手
  8. 设计师必备!免费下载 PSD 素材的32个网站
  9. [实践篇]13.12 教你读懂QNX座舱方案里的高频术语
  10. 练习---打印出电影天堂中电影的下载链接