New interpretable deep learning model to monitor real-time PM2.5 concentrations from satellite data

1 文章概述

摘要

本文提出了一个新的深度学习模型—EntityDenseNet,用于从同步卫星上提供的高时间分辨率的数据提取出地面PM2.5浓度。该模型相比传统机器学习模型有更高的精度,且有更好的可解释性。对于类别数据,本文采取了一种新的方式进行编码。

引言

数据方面问题:

  • 虽然世界各地都在监测PM2.5的浓度,但是地面站点分布的不够广泛且不均匀,这使得捕捉PM2.5的可变性和模型变得困难。所以基于卫星的气溶胶遥感(气溶胶光学厚度,AOD)已被广泛用于估算PM2.5。
  • 两种卫星数据比较:
    • Polar-orbiting satellites:在白天,每天只提供一次测量,这使得它不能监测空气质量的时间演变。
    • Himawari-8:日本新一代气象卫星,以10分钟为间隔提供区域AOD数据,但没有实时PM2.5数据
  • Remote Sensing of Particulate Pollution from Space(2009):回顾了200多项研究,并得出结论,AOD pm 2.5的精度为30%(最大值),只有使用额外的输入参数(如气象和大气剖面信息)才能进行估计。但是通过模型模拟以相等的卫星空间分辨率(例如,5公里或1公里)和覆盖范围获得气象和大气剖面数据是非常耗时的,所以在没有气象或大气剖面信息的情况下仍能达到30%的监测pm 2.5精度的能力是有问题的。

神经网络方面:

  • 独热编码存在两个问题: 需要较高算力、 且将各个分类视为相互独立

2 网络模型

2.1 模型结构

网络总体框架图如下:整体网络结构就是简单的BN layer、Dropout layer 和FC layer的堆叠。但是在两个隐藏层的传递过程中第一个隐藏层的输出乘了一个伯努利随机变量的向量(文中并没有对这个操作加以解释)。

输入数据处理部分:

本文将输入数据分为两个部分:离散变量(例如:月份,年,日期,小时,中国行政区划分等等),和连续变量

  • 离散数据的处理:

    以月份为例子:本文通过生成一个12*D的随机二维矩阵,该矩阵的每一行(一维向量)对应于特定的月份信息。这个1 × D向量被附加到连续变量上,用于神经网络训练和预测,如下图所示。

  • 连续数据的处理

    每个连续变量xi首先通过Z-score方法进行标准化,公式如下:

    Normalized  ( x i ) = x i − mean ⁡ ( x ) std ⁡ ( x ) std ⁡ ( x ) = 1 n − 1 ∑ i = 1 n [ x i − mean ⁡ ( x ) ] 2 \begin{array}{l} \text { Normalized }\left(x_{i}\right)=\frac{x_{i}-\operatorname{mean}(x)}{\operatorname{std}(x)} \\ \operatorname{std}(x)=\sqrt{\frac{1}{n-1} \sum_{i=1}^{n}\left[x_{i}-\operatorname{mean}(x)\right]^{2}} \end{array}  Normalized (xi​)=std(x)xi​−mean(x)​std(x)=n−11​∑i=1n​[xi​−mean(x)]2 ​​

2.2 模型训练

文中各个层的权重采用Xavier初始化方法,该方法在近两年内开始被广泛使用,能有效提高模型的性能。“Xavier”初始化方法是一种很有效的神经网络初始化方法,方法来源于2010年的一篇论文《Understanding the difficulty of training deep feedforward neural networks》。文章主要的目标就是使得每一层输出的方差应该尽量相等。

详细方法:参考 以下博客Xavier

在通过嵌入方法处理完类别数据后,文中使用了Uniform Manifold Approximation and Projection (UMAP)算法:它可以提供嵌入分类变量的高维特征空间的低维表示,同时保持原始特征空间的全局结构。利用UMAP将嵌入层矩阵从训练好的实体网映射到3D,使我们能够计算该3D坐标系中不同变量之间的余弦距离。余弦距离定义如下: CosineDistance  = 1 − ∑ i = 1 n x i y i ∑ i = 1 n x i 2 ∑ i = 1 n y i 2 \text { CosineDistance }=1-\frac{\sum_{i=1}^{n} x_{i} y_{i}}{\sqrt{\sum_{i=1}^{n} x_{i}^{2}} \sqrt{\sum_{i=1}^{n} y_{i}^{2}}}  CosineDistance =1−∑i=1n​xi2​ ​∑i=1n​yi2​ ​∑i=1n​xi​yi​​。两者余弦距离越小说明他们具有越高的相似性。

New interpretable deep learning model to monitor real-time PM2.5 concentrations from satellite data相关推荐

  1. The Wide and Deep Learning Model(译文+Tensorlfow源码解析) 原创 2017年11月03日 22:14:47 标签: 深度学习 / 谷歌 / tensorf

    The Wide and Deep Learning Model(译文+Tensorlfow源码解析) 原创 2017年11月03日 22:14:47 标签: 深度学习 / 谷歌 / tensorfl ...

  2. 【翻译】Sibyl: Host Load Prediction with an Efficient Deep Learning Model in Cloud ComputingSibyl:高效的深度学

    [翻译]Sibyl: Host Load Prediction with an Efficient Deep Learning Model in Cloud ComputingSibyl:高效的深度学 ...

  3. 虚假新闻检测论文阅读(六):A Deep Learning Model for Early Detection of Fake News on Social Media

    论文标题:A Deep Learning Model for Early Detection of Fake News on Social Media 日期:IEEE2020 #半监督.#伪标签.#可 ...

  4. 【CTR预估】The Wide and Deep Learning Model(译文+Tensorlfow源码解析)

    本文主要讲解Google的Wide and Deep Learning 模型.本文先从原始论文开始,先一步步分析论文,把论文看懂.再去分析官方开源的Tensorflow源码,解析各个特征的具体实现方法 ...

  5. 论文阅读笔记之Replacing Mobile Camera ISP with a Single Deep Learning Model

    这篇文章做了啥 根据ccd或者cmos图像传感器获得的图像,要经过一系列的复杂的处理才能得到最终的图像,而且不同的cmos有不同的算法,作者这里的motivation是能不能有一个比较统一的框架来处理 ...

  6. A deep learning model integrating FCNNs and CRFs for brain tumor segmentation

    摘要: 1.通过将完全卷积神经网络(FC-NN)和条件随机场(CRF)集成在一个统一的框架中,得到一种新的脑肿瘤分割方法,以获得具有外观和空间一致性的分割结果. 2.步骤: 我们使用2D图像训练基于深 ...

  7. Deep Learning for Chatbots, Part 2 – Implementing a Retrieval-Based Model in Tensorflow

    Retrieval-Based bots In this post we'll implement a retrieval-based bot. Retrieval-based models have ...

  8. 【Paper】Deep Learning for Anomaly Detection:A survey

    论文原文:PDF 论文年份:2019 论文被引:253(2020/10/05) 922(2022/03/26) 文章目录 ABSTRACT 1 Introduction 2 What are anom ...

  9. In on deep learning

    转自:http://markus.com/deep-learning-101/?utm_campaign=Manong_Weekly_Issue_11&utm_medium=EDM&u ...

最新文章

  1. 基础学习总结(四)--SQLite
  2. 【翻译】ASP.NET WEB API异常处理
  3. wxpython视频教程-单片机C语言入门_单片机教程_单片机编程语言 - C语言网
  4. 【问题】定时任务整理笔记附问题求大佬解答!!!!
  5. native字体尺寸自适应 react_react-native中 屏幕以及字体 大小适配
  6. Do not wait until the conditions are perfect to begin. Beginning makes the conditions perfect(转)...
  7. 【转】Java MySQL数据类型对照
  8. 基于PaaS平台的多应用自集成方案之公共数据集成
  9. android wifi在待机状态下可用,Android APP休眠状态下无法联网和播放音频解决方案...
  10. mysql-bin日志文件清理
  11. Robot Framework自动化测试(一)---第一个脚本
  12. 传输线理论  特征阻抗
  13. Linux-whereis find locat which半解
  14. destoon php版本,Destoon 7.0最新版常见问题解决方法
  15. 2021年了,微信公众号还有前途吗?
  16. 【21天习惯养成记~~day17晚】
  17. 阿里云服务器出错500 - 内部服务器错误
  18. 《静态时序分析实用方法》第七章翻译
  19. Python之文件处理-JSON文件
  20. 超强反爬虫方案!Requests 什么的通通爬不了

热门文章

  1. 利用shell脚本给数据库创建表
  2. 深度Linux使用小记 (附带视频)
  3. 虚拟服务器与本地服务器互拼丢包,路由器与游戏服务器之间丢包
  4. Unity3D对象池的设计
  5. 会员模块(会员注册、会员登录、忘记密码、会员中心)
  6. 骁龙888plus和a14详细参数对比 骁龙888plus和a14差距
  7. 我在2008中国软件大会上的演讲稿
  8. Spring事务实现原理
  9. 人工智能在未来是怎样改变大都市生活的?
  10. 维特比算法的python实现