文章来源:BMVC 2015

作者信息:Dan Xu ,Postdoctoral Researcher ,Visual Geometry Group (VGG)
Department of Engineering Science,University of Oxford
主要内容:第一次将深度特征用于异常事件检测。提出AMDN架构,分为Appearance,Motion,Joint 3个通道,并对通道信息进行了两次融合。用SDAE(降噪自编码机)得到视频特征的稀疏表示,利用One-class SVM来检测异常事件。

网络结构

Appearance representation:
1.利用一个多尺度的滑动窗口来提取patches
2.将这些patches缩放到相同大小( w a , h a , c a w_a,h_a,c_a wa​,ha​,ca​),其中 c a c_a ca​为通道数,并规范到[0,1]
3.输入到堆叠4层的encoder layer,第一层的神经元个数为( v a , w a , h a , c a v_a,w_a,h_a,c_a va​,wa​,ha​,ca​),这个 v a v_a va​是用来构建一个完备滤波器组的扩增量。

Motion representation:
1.固定大小为( w m , h m , c m w_m,h_m,c_m wm​,hm​,cm​)的滑动窗口来对光流特征图像提取patches,其中 c m = 2 c_m=2 cm​=2对应于光流的x,y两个坐标方向。
2.在每个通道中规范到[0,1]
3.堆叠4层的encoder layer,第一层的神经元个数为( v m , w m , h m , c m v_m,w_m,h_m,c_m vm​,wm​,hm​,cm​)

Joint representation:
直接将灰度图像和光流图像提取到的patches进行逐像素融合,得到Joint representation的patches.

SDAE

最简单情况(3层):
encoder: f ( W , b ) f(W,b) f(W,b)
decoder: f ( W ′ , b ′ ) f(W',b') f(W′,b′)
hidden layer: h h h
x ′ x' x′为 x x x加入噪声后的信号
h i = f e ( x ′ ∣ W , b ) = δ ( W x ′ + b ) h_i=f_e(x'|W,b)=\delta(Wx'+b) hi​=fe​(x′∣W,b)=δ(Wx′+b) (编码)
x ^ = f d ( h i ∣ W ′ , b ′ ) = s ( W ′ h i + b ′ ) \hat{x}=f_d(h_i|W',b')=s(W'h_i+b') x^=fd​(hi​∣W′,b′)=s(W′hi​+b′)(解码)
target : min ⁡ W , W ′ , b , b ′ ∑ i = 1 N ∣ ∣ x i − x i ^ ∣ ∣ 2 2 + λ ( ∣ ∣ W ∣ ∣ F 2 + ∣ ∣ W ′ ∣ ∣ F 2 ) \min\limits_{W,W',b,b'}\sum_{i=1}^N||x_i-\hat{x_i}||_2^2+\lambda(||W||_F^2+||W'||_F^2) W,W′,b,b′min​∑i=1N​∣∣xi​−xi​^​∣∣22​+λ(∣∣W∣∣F2​+∣∣W′∣∣F2​)(最小化重构误差)
多层情况(2L+1)层
target : min ⁡ W , W ′ , b , b ′ ∑ i = 1 N k ∣ ∣ x i − x i ^ ∣ ∣ 2 2 + λ F ∑ i = 1 L ( ∣ ∣ W i k ∣ ∣ F 2 + ∣ ∣ W i ′ k ∣ ∣ F 2 ) \min\limits_{W,W',b,b'}\sum_{i=1}^{N^k}||x_i-\hat{x_i}||_2^2+\lambda _F\sum_{i=1}^L(||W_i^k||_F^2+||W_i^{'k}||_F^2) W,W′,b,b′min​∑i=1Nk​∣∣xi​−xi​^​∣∣22​+λF​∑i=1L​(∣∣Wik​∣∣F2​+∣∣Wi′k​∣∣F2​)
这可以通过梯度下降法来优化。
最终,取隐藏层的特征 s i k = δ L ( δ L − 1 ( … δ 1 ( W 1 k x i k + b 1 k ) ) s_i^k=\delta_L(\delta_{L-1}(\ldots\delta_1(W_1^kx_i^k+b_1^k)) sik​=δL​(δL−1​(…δ1​(W1k​xik​+b1k​))来表示视频信息。

One-class SVM
training sample:
S = { s i k } i = 1 N k S=\{s_i^k\}_{i=1}^{N^k} S={sik​}i=1Nk​
target:
min ⁡ w , ρ 1 2 ∣ ∣ w ∣ ∣ 2 + 1 V N k ∑ i = 1 N k ξ i − ρ \min\limits_{w,\rho}\frac12||w||^2+\frac1{VN^k}\sum_{i=1}^{N^k}\xi_i-\rho w,ρmin​21​∣∣w∣∣2+VNk1​∑i=1Nk​ξi​−ρ
s t w T Φ ( s i k ) ≥ ρ − ξ i st\qquad w^T\Phi(s_i^k)\geq\rho-\xi_i stwTΦ(sik​)≥ρ−ξi​
ξ i \xi_i ξi​:松弛变量
ρ \rho ρ:超球面半径
Φ \Phi Φ:映射函数,将数据映射到其他空间
One-class SVM的思想是训练出一个超球面,使得正常数据在球面内,而异常数据在球面外。松弛变量是为了避免对少数噪声数据的过拟合。对于样本t的k通道(有Appearance,Motion,Joint3个通道)数据来说 s t k s_t^k stk​,它的异常分数为:
A k ( s t k ) = ρ − w T Φ ( s t k ) A^k(s_t^k)=\rho-w^T\Phi(s_t^k) Ak(stk​)=ρ−wTΦ(stk​)

Late Fusion
由于3个通道得到了3个异常分数,late fusion将对这3个分数进行融合:
A ( s t k ) = ∑ k ∈ { A , M , J } α k A k ( s t k ) A(s_t^k)=\sum\limits_{k\in\{A,M,J\}}\alpha^kA^k(s_t^k) A(stk​)=k∈{A,M,J}∑​αkAk(stk​)
而权重向量将通过学习得到:
min ⁡ w s k , α s k ∑ k α k t r ( W s k S k ( W s k S k ) T ) + λ s ∣ ∣ α ∣ ∣ 2 2 \min\limits_{w_s^k,\alpha_s^k}\sum\limits_k\alpha^ktr(W_s^kS^k(W_s^kS^k)^T)+\lambda_s||\alpha||_2^2 wsk​,αsk​min​k∑​αktr(Wsk​Sk(Wsk​Sk)T)+λs​∣∣α∣∣22​
s t α k > 0 , ∑ k α k = 1 st \qquad \alpha^k>0,\sum\limits_k\alpha^k=1 stαk>0,k∑​αk=1
取 W s k W_s^k Wsk​为 S k S k   T S^kS^{k\, T} SkSkT的前d大特征值对应的特征向量,则 α \alpha α可以由如下方法得到:
min ⁡ α k > 0 , ∑ k α k = 1 1 2 ∣ ∣ α − c ∣ ∣ 2 2 \min\limits_{\alpha^k>0,\sum\limits_k\alpha^k=1}\frac12||\alpha-c||_2^2 αk>0,k∑​αk=1min​21​∣∣α−c∣∣22​
c = [ c A , c M , c J ] c=[c^A,c^M,c^J] c=[cA,cM,cJ]
c k = − 1 2 λ s t r ( W s k S k ( W s k S k ) T ) c^k=-\frac1{2\lambda_s}tr(W_s^kS^k(W_s^kS^k)^T) ck=−2λs​1​tr(Wsk​Sk(Wsk​Sk)T)
最终通过 A ( s t k ) A(s_t^k) A(stk​)是否大于阈值 η \eta η来判断是否为异常行为

实验结果


表1用几种最先进的方法从曲线下面积(AUC)和等差率(EER)两方面对ROC曲线进行了定量比较。从框架级的评价来看,这个方法的性能比当时的许多方法要好。此外,考虑到像素级的评估,即异常定位的准确性,使得这种方法在EER和AUC方面都优于所有的竞争方法。
表1还显示了拟议的双融合策略的优点。与早期融合和后期融合相比,AMDN保证了更好的性能。
具体来说,对于早期融合,只使用用Joint这一个支持向量机。对于后期融合,采用两条独立的外观和运动管道以及所提出的融合方案,但放弃了Joint通道。有趣的是,在这个应用程序中,后期融合策略优于早期融合策略

文献阅读笔记2: Learning Deep Representation of Appearance and Motion for Anomalous Event Detection相关推荐

  1. [文献阅读笔记]Machine Learning DDoS Detection for Consumer Internet of Things Devices 2018 IEEE SPW

    [文献阅读笔记]Machine Learning DDoS Detection for Consumer Internet of Things Devices 2018 IEEE SPW 1.INTO ...

  2. 【裂缝检测】文献阅读笔记

    本笔记仅供个人回顾使用,未经允许禁止转发 文献相关网站: 中国知网 iData 爱学术[中文文献友好] 一搜即达[科研通聚合搜索] SCI-Hub论文下载可用网址 谷歌学术『Google』镜像 谷歌学 ...

  3. 研究生如何做文献阅读笔记

    ** 研究生如何做文献阅读笔记 ** 研究生如何做文献阅读笔记? 说实在的,我自己也不是很会读书.读书的速度也不快,只是喜欢读书罢了.阅读文献,对于开题期间的研究生和写论文期间的研究生是很重要的功课, ...

  4. 文档资源推荐 研究生如何做文献阅读笔记(强力推荐!!!)

    转自:http://www.soudoc.com/bbs/viewthread.php?tid=9056542&extra=&page=1 研究生如何做文献阅读笔记? 说实在的,我自己 ...

  5. 文献阅读笔记:EvolveGraph: Multi-Agent Trajectory Prediction with Dynamic Relational Reasoning

    文献阅读笔记 摘要 1 引言 2 相关工作 3 Problem formulation 4 EvolveGraph 5 Experiments 6 结论 EvolveGraph: Multi-Agen ...

  6. 文献阅读笔记----TieNet: Text-Image Embedding Network

    文献阅读笔记----TieNet: Text-Image Embedding Network for Common Thorax Disease Classification and Reportin ...

  7. 【知识图谱】本周文献阅读笔记(3)——周二 2023.1.10:英文)知识图谱补全研究综述 + 网络安全知识图谱研究综述 + 知识图谱嵌入模型中的损失函数 + 图神经网络应用于知识图谱推理的研究综述

    声明:仅学习使用~ 对于各文献,目前仅是泛读形式,摘出我认为重要的点,并非按照原目录进行简单罗列! 另:鉴于阅读paper数目稍多,对paper内提到的多数模型暂未细致思考分析.目的是总结整理关于KG ...

  8. 论文阅读笔记——VulDeePecker: A Deep Learning-Based System for Vulnerability Detection

    本论文相关内容 论文下载地址--Engineering Village 论文中文翻译--VulDeePecker: A Deep Learning-Based System for Vulnerabi ...

  9. 文献阅读笔记-CSC-数据集-A Hybrid Approach to Automatic Corpus Generation for Chinese Spelling Check

    A Hybrid Approach to Automatic Corpus Generation for Chinese Spelling Check 文献阅读笔记 论文相关信息: EMNLP-201 ...

最新文章

  1. 怎么卸载Apache_pn服务-PHPnow使用问题
  2. Effective Java:对于所有对象都通用的方法
  3. Shell - 文件运算符
  4. 洛谷——P1042 乒乓球
  5. ecplice java run_java – EventDispatchThread.run()行:eclipse中不...
  6. linux 往文件写4k大小,[svc]为何linux ext4文件系统目录默认大小是4k?
  7. ssl2645-线段树练习2【线段树】
  8. CoreJava学习第五课 --- 进入第二阶段:面向对象编程思想
  9. drools 7.x 模板的简单使用
  10. android studio 分页,Android Paging codelab
  11. 2017 年全球十大突破技术:逼格很高很难懂
  12. shell 字符(串)处理命令
  13. 关于出现Not an editor command: Bundle ‘**/*.vim‘的解决方案【转】
  14. 智能优化算法:蛇优化算法-附代码
  15. Linux网络编程和套接字
  16. dos窗口运行java程序时中文乱码的解决方法
  17. cxfservlet_webService框架CXF的简单使用
  18. 三菱plc串口通讯c语言,三菱plc串口通信协议与串口初始化
  19. 你不知道的几个牛逼网站,欢迎收藏
  20. RestTemplate上传图片到指定接口

热门文章

  1. LeetCode:有效的括号
  2. 好吧,左小波出山了!
  3. 什么样的人要学点python编程?对号入座,附赠教程
  4. SSH服务详解(一)–Linux SSH 服务器与客户端的安装与启动
  5. 【asp】如何打开asp文件,包括IIS安装,HTTP错误403.14,配置默认文档,启用目录浏览
  6. python逻辑回归优化参数_逻辑回归模型怎么调整超参?
  7. python是什么?干什么用的?(1)
  8. DOS Network一月项目月报 1
  9. 技巧 | 如何快速生成文件清单
  10. 程序死锁了,我该怎么办?