论文选读:Maximizing the Spread of Cascades Using Network Design
Introduction
在社会学和生态学中,经常会有cascade出现。所谓cascade指一个个体的行为被不停传导至网络的其他部分。生态学中提出了一个模型叫metapopulation modeling.
一个常见的问题是个体最大化其在网络中的传播。但是,不好量化随机过程。本文针对这一特点提出了一个优化框架。
这个问题很有现实意义。在商业活动中,选k个人作为初始传播者,使最终的传播最广,这是一个次模问题。贪心可以获得近似最优解。
在metapopulation modeling当中,初始位置确定不能变化,最终的结果也更受地形影响,而不是初始位置。
本文的模型更加通用。不但可以选择初始点,还可以通过增加顶点来影响cascade过程。加边和改变传播概率的操作也可以包括在内。这个问题不次模,所以是个混合整数规划(mixed integer program (MIP))问题。SAA(sample average approximation) 是我们的主要计算工具,它提供了一种解法,数据小时可能overfit,但是数据足够多时可以吻合样例。除了SAA/MIP,还提出了一些预处理的优化技巧。
最终,我们的模型在现实中被用来保护RCW,效果很牛逼。
Problem Statement
2.1 progressive cascade
progressive cascade : 有一组起始点,在图中随机传播使得邻接点active,直到某一时刻无法传播。给了一个target nodes集合TTT,一个有限的management budget,选一些management action使得active的TTT中点最多。点被激活后就永生了。
independent cascade model 每个点激活后只能随机传播一次,无论成功与否
live edge : For each edge (v,w)∈E(v, w) ∈ E(v,w)∈E, flip a coin with probability pvw to decide whether the edge is live.
cascade graph: subgraph G′G'G′ consisting of live edges be called the cascade graph
A=1,2,...LA = {1,2,...L}A=1,2,...L – management actions
clc_lcl – cost
yyy – strategy 0/1 vector
SSS – Source Set
TTT – target nodes set
BBB – Budget
pvw/p(v,w)p_{vw}/p(v, w)pvw/p(v,w) – 转移概率
Problem:
2.2 Non-progressive Cascade
non-progressive cascade : 被激活的点可能重新变为死点。这种情况下的图可以转化为progressive cascade,只需要为每个时间单独列出一组点,且边只能由 ttt 时间连向 t+1t+1t+1 即可。
vi,t∈VTv_{i,t} ∈ V^Tvi,t∈VT表示时刻 ttt,点编号为 iii 的点。
βi\beta_iβi表示 iii 号点在下一时间存活的概率。
2.3 Management Actions
G0=(V0,E0)G_0=(V_0,E_0)G0=(V0,E0) – 已经激活的点集V0V_0V0对应的图
VlV_lVl – 第lll次操作买的点集
V=V0∪∑VlV = V_0 ∪ \sum V_lV=V0∪∑Vl
GGG ----- VVV 对应的图
V(y)V (y)V(y) – 被买的点集 G(y)G(y)G(y) – 对应的子图
Xv(y)X_v (y)Xv(y) – G(y)G(y)G(y)当中cascade激活的点集
买点的模型可以用来描述买边的模型。将 (v,w)(v, w)(v,w) 用 (v,e)(e,v)(v, e)(e, v)(v,e)(e,v)两条边代替,eee代表买边。概率p0(v,e)=p(v,w),p0(e,w)=1p_0(v, e) = p(v, w), p_0(e, w) = 1p0(v,e)=p(v,w),p0(e,w)=1
2.4 Conservation Application
讲了一个metapopulation model的例子,这类模型属于non-progressive cascade 。点数编号 iii 转化为patch编号。TTT 表示总时间。问题描述和之前的文章当中一样,不再赘述。
2.5 Non-Submodularity
上述问题是非次模的。然后举反例说明。
Related Work
废话挺多,跳过。
Methodology
Sample Average Approximation
在随机问题中取n个场景,把随机优化问题变为确定问题。
在原图GGG中事先抛硬币构建新图G′G'G′。G1′,...,GN′⊆GG_1', . . . , G_N' ⊆ GG1′,...,GN′⊆G取名叫training cascades。ξvk(y)=0/1ξ_v^k(y)=0/1ξvk(y)=0/1表示点v在图Gk′(y)G_k'(y)Gk′(y)中是否可达。式子1的估值就是
在non-progressive cascade当中,用可达性xvkx_v^kxvk表示ξvk(y)ξ_v^k(y)ξvk(y)。
问题如下:
现在问题变为了:买哪些点集,使得可以到达的target nodes最多?
Bounds ???
problems:
how to calculate ZiZ_iZi?
how reestimate best solution y?
Preprocessing
怎样预处理cascade提高效率?
- Pruning 忽略s到不了的点和到不了t的点。
- Collapsing Sources 如果SSS到vvv的路径上只有初始图V0V_0V0的边,就把vvv也加入到source SSS里。最后,用一个统一的点表示SSS当中的所有点。此外,还可以把所有具有相同性质的点缩成一个点。
u⇒vu ⇒ vu⇒v 表示如果u可达,v也可达。有两种情况可以得到这个结论:
- (u,v)∈E(u, v) ∈ E(u,v)∈E and A(u)⊆A(v)A(u) ⊆ A(v)A(u)⊆A(v). I.e., u links to v,
and whenever u is purchased v is also purchased. - (v,u)∈E(v, u) ∈ E(v,u)∈E and /∃w:(w,u)∈E/∃w : (w, u) ∈ E/∃w:(w,u)∈E. I.e., the only
link to u comes through v; hence, any path that
reaches v must go through u.
用上面两种情况可以构造有向图,找出所有的强连通分量CCC,并缩点。之后还需要更新原问题的其他参数:(i) (ii) (iii)
Greedy Baselines
两个baseline: greedy-uc / greedy-cb
greedy-uc : 每次选择使objective value增加最多的方案。
greedy-cb : 每次选择使objective value增量和花费增量之比增加最多的方案。
贪心算法每次的操作有后效性。所以,可以把VlV_lVl的点加入到V0V_0V0当中,重复preprocessing的过程。这一层优化效果显著。
论文选读:Maximizing the Spread of Cascades Using Network Design相关推荐
- 【论文笔记】DR-TANet: Dynamic Receptive Temporal Attention Network for Street Scene Change Detection
论文 论文题目:DR-TANet: Dynamic Receptive Temporal Attention Network for Street Scene Change Detection 收录: ...
- 论文阅读 [TPAMI-2022] DE-GAN: A Conditional Generative Adversarial Network for Document Enhancement
论文阅读 [TPAMI-2022] DE-GAN: A Conditional Generative Adversarial Network for Document Enhancement 论文搜索 ...
- 论文翻译: Adaptive implicit friends identification over heterogeneous network for social recommendation
论文: Adaptive Implicit Friends Identification over Heterogeneous Network for Social Recommendation (C ...
- 论文阅读”Multigraph Fusion for Dynamic Graph Convolutional Network“(TNNLS2022)
论文标题 Multigraph Fusion for Dynamic Graph Convolutional Network 论文作者.链接 作者: Gan, Jiangzhang and Hu, R ...
- 【论文泛读】 Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift
[论文泛读] Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift ...
- 论文阅读:Instance-aware Semantic Segmentation via Multi-task Network Cascades
论文框架: 作者提出一种基于多任务的网络串联方法(Multi-task Network Cascade),解决问题实例分割(Instance-aware Semantic Segmentation). ...
- 论文翻译:2019_Speech Super Resolution Generative Adversarial Network
博客作者:凌逆战 论文地址:基于GAN的音频超分辨率 博客地址:https://www.cnblogs.com/LXP-Never/p/10874993.html 论文作者:Sefik Emre Es ...
- 论文翻译:Speech Super Resolution Generative Adversarial Network
博客作者:凌逆战 论文地址:https://ieeexplore.ieee.org/document/8682215 博客地址:https://www.cnblogs.com/LXP-Never/p/ ...
- 论文笔记 A Spatial-Temporal Decomposition Based Deep Neural Network for TimeSeries Forecasting
0 abstract 空间时间序列预测问题出现在广泛的应用中,如环境和交通问题.由于存在特定的空间.短期和长期模式,以及维度的诅咒,这些问题具有挑战性. 在本文中,我们提出了一个用于大规模空间时间序列 ...
最新文章
- 专访UC伯克利人工智能教授:机器学习的最强敌人是谁?
- No module named 'xxx’
- 好强大的仿生机械,这才是真正的黑科技!
- word List35
- Linux 用户 和 用户组 管理 (添加、删除、修改)及说明
- AI是计算机科学,人工智能计算机科学(79种)...
- Vue在组件上使用v-model
- 音视频开发(19)---Android视频开发基础(一)
- xbox360fsd更新游戏封面_Steam推出了新版游戏库,界面更为简洁
- Android学习--10-数据存储
- 中国烧鹅系列:利用烧鹅自动执行SD卡上的自定义程序(含视频)
- linux命令大全之ss命令详解(获取socket统计信息)
- matlab 最小割集(需手动分析排除)
- 富文本编辑器开发系列-1-基础概念
- openfire4.2.1 + smack4.2.2即时通信工具开发(android端登录、发送消息、接收消息)
- Flutter 混合开发
- python贷款_Python贷款逾期分析
- MKMapView 自定义大头针
- 信号完整性之浅谈理解(一)
- 【Abp VNext】实战入门(四):Windows系统服务制作