时空序列预测:SimVP: Simpler yet Better Video Prediction解读
文章摘要:从CNN、RNN到VIT,包含了辅助输入,精细的神经架构和复杂的训练策略。是否有一种简单的方法可以表现得同样好?本文提出了SimVP模型,并通过MSE LOSS以端到端的方式进行训练。
github代码地址:GitHub - ryok/SimVP-Simpler-yet-Better-Video-Prediction
文章地址:SimVP: Simpler Yet Better Video Prediction (thecvf.com)
论文模型结构:
模型的结构由三部分组成:
Encoder:编码器堆叠个卷积模块,通过堆叠来用来提取空间特征。其在代码中过堆叠了4层来进行空间特征提取,在代码中采用的是GroupNorm并未采用LayerNorm,其中将GroupNorm的num_group设置为了2,其并不是LayerNrom。(GN的极端情况就是LN和IN,分别对应G等于C和G等于1)
Translator:该模块采用初始化来学习时间演化。在代码中Translator是由Inception结构堆叠而成,Inception结构首先通过了一个1×1的卷积核,而后使用卷积核大小为(3,5,7,11)来分别进行卷积,最后将特征图进行拼接。SimVP模型在Translator通过Inception单元堆叠出了一个Encoder-Decoder结构,这个Encoder-Decoder结构的深度共8层,通过这种方式来进行时间特征的提取得到时间演化效果。
Decoder:解码器利用个反卷积来重构地面真实帧,该地面真实帧在(H,W)上卷积C个通道,从而实现对Translator信息的解码工作,Decoder与Encoder近乎相似,只是将卷积操作改成了反卷积操作。Decoder堆叠的方式如下式:
总结:SimVP不使用RNN、LSTM和Transformer等高级模块,也不引入对抗性训练和采样学习等复杂的训练策略,所有的模块都是CNN组成、在训练过程中采用的损失函数为MSE LOSS。
论文模型训练实验:
论文中所用数据集:
在五个数据集上进行了实验,代表训练集个数、
代表测试集个数。
代表通道的图像分辨率,
和
代表了输入长度和预测长度。
由表中数据可以看出,模型在MAE、MSE、SSIM上都进行了评估,该模型不仅相较于其他的结构模型轻量化,而且其在视频预测领域有比较好的效果。作者最后希望该模型成为一个视频预测领域对比的基线模型。
时空序列预测:SimVP: Simpler yet Better Video Prediction解读相关推荐
- 卷积LSTM网络应用于时空序列预测
时空序列预测问题是输入的是按照某一时刻之前若干个时刻表示空间信息的二维矩阵,预测某一时刻后面若干个时刻的空间状态.可以形式化为: 卷积LSTM(Convolutional LSTM)是把卷积神经网络的 ...
- 【时空序列预测实战】风险时空预测?keras之ConvLSTM实战来搞定
作者 | Eric琨 学校 | 武汉大学信管 研究 | NLP.时空序列 出品 | AI蜗牛车 前言 毕设临近截止,故写一篇心得以供新手学习,理论在知乎上有很多介绍的不错的文章,这里强烈推荐微信公众号 ...
- 【时空序列预测第二篇】Convolutional LSTM Network: A Machine Learning Approach for Precipitation Nowcasting
个人公众号 AI蜗牛车 作者是南京985AI硕士,CSDN博客专家,研究方向主要是时空序列预测和时间序列数据挖掘,获国家奖学金,校十佳大学生,省优秀毕业生,阿里天池时空序列比赛rank3.公众号致力于 ...
- 【时空序列预测paper】ConvLSTM:A Machine Learning Approach for Precipitation Nowcasting
前言: 论文和两位大佬的解读一起看AI蜗牛车 和翻滚的小@强 论文原文:Convolutional LSTM Network: a machine learning approach for prec ...
- 2021AIOps挑战赛|基于移动通信网络运维中的多指标时空序列预测
2021国际AIOps挑战赛决赛暨AIOps创新高峰论坛于2021年5月13日在北京成功举行.本文根据中国移动研究院首席科学家.人工智能与智慧运营中心总经理冯俊兰博士现场发言纪要整理而成. 演讲内容 ...
- 中国移动研究院冯俊兰:基于移动通信网络运维中的多指标时空序列预测
这和我当年做的工作就很像了. 转载自:https://mp.weixin.qq.com/s/veqH753nxWW0Hr0PDB1uSg 中国移动研究院冯俊兰:基于移动通信网络运维中的多指标时空序列预 ...
- 【时空序列预测第四篇】PredRNN++: Towards A Resolution of the Deep-in-Time Dilemma in Spatiotemporal Predictive
前言 保持住节奏,每周起码一篇paper reading,要时刻了解研究的前沿,是一个不管是工程岗位还是研究岗位AIer必备的工作,共勉! 准备再写几篇这种非常细致的文章之后,接下来写作主要集中在模型 ...
- 【时空序列预测第十五篇】HPRNN: A HIERARCHICAL SEQUENCE PREDICTION MODEL FOR LONG-TERM WEATHER RADAR ECHO EXTRAPO
一.Address 来自NUDT的一篇ICASSP paper HPRNN: A HIERARCHICAL SEQUENCE PREDICTION MODEL FOR LONG-TERM WEATHE ...
- Memory in Memory(MIM)时空序列预测学习总结
动机:作者发现PredRNN中的遗忘门总是处于负饱和中(ft<0.1)会出现灾难性遗忘. 下面给出解释 LSTM内部结构 如图为LSTM的内核,它一部分时间信息是存储在Ct中的,而Ct每一时间步 ...
最新文章
- 艾伟_转载:.NET设计模式:观察者模式(Observer Pattern)
- centos得mysql安装教程_Centos下Mysql安装图文教程_MySQL
- php系统导出数据到excel,php导出大量数据到excel时,有哪些比较好的处理方法?...
- 细胞转染的操作步骤及注意事项
- 淘宝搜索中基于embedding的召回
- Linux 命令之 typeset -- 声明 shell 变量,设置变量的属性
- Docker制作dotnet core控制台程序镜像
- java swing panel问题_关于 Java swing Box 的使用问题
- 【JUC】JDK1.8源码分析之ConcurrentHashMap
- 南亚三大半岛_南亚最大的维基百科聚会开始
- JavaScript 图
- 火山同传助力第四届CTDC首席技术官领袖峰会
- 【SVN】Eclipse SVN插件下载安装
- armbian 斐讯n1_[流水账记录] 斐讯N1刷armbian到emmc并安装Docker!
- hublider配置php环境(wamp、phpstudy,php工具箱...)
- 删除回收站右键找回清空的文件
- 移植linux内核串口配置,uClinux内核的移植 - bootloader对uClinux的S3C44B0移植
- 二十四节气和计算机专业,命理学与二十四节气的关系
- 微信公众平台 微接口 接口100 API100 接口大全
- DMP (Dynamic Movement Primitives) 动态运动基元
热门文章
- IDEA中的Project与Module的概念及使用方法
- 让各种开机自启的程序实现延时启动,来加快开机时间
- MATLAB程序控制结构之顺序结构
- pycharm专业版创建flask项目|下载flask包|以及一些例子
- 小米集团副总裁崔宝秋:开源是人类技术进步的最佳平台和模式
- python的chr可以转换中文吗_Python3的内置函chr和ord及进制转换,format
- wordpress采集器-wordpress采集器安装下载教程
- md开源云笔记php,开源在线云笔记 ManGe-Notes
- 基于异构信息网络的恶意账号检测
- 网上搜集到iOS开发中获取手机IDFA,手机序列号,设备名称,别名,分辨率等信息,这里做个总结