1. 病毒式营销

针对社交网络中最有影响力的用户(例如,通过向他们提供免费或价格优惠的样本),人们可以通过口碑利用网络效应的力量,从而将营销信息传递到网络的很大一部分。

2. 影响力最大化:病毒式营销的关键算法

在一个在线社交网络中选择一组k个用户,即选出具有最大影响力传播的种子集,然后通过信息传播中的种子集来影响用户的预期数量最大。

2.1. 定义:扩散模型和影响扩散

给定社交图 G=(V,E)G = (V,E)G=(V,E),一个用户集 S⊆VS⊆ VS⊆V,扩散模型MMM捕获SSS在GGG上传播信息的随机过程。SSS的影响力扩散(也称为影响力函数),以σG,M(S)σ_{G,M}(S)σG,M​(S)表示,是受SSS影响的预期用户数(例如,在病毒性营销中采用新产品的用户),其中σG,M(⋅)σ_{G,M}(·)σG,M​(⋅)是在用户的任何子集上定义的非负集合函数,即σG,M:2V→R≥0σ_{G,M}:2^V→ R≥0σG,M​:2V→R≥0。

2.2. 定义:影响最大化(IM)

给定社交图GGG,扩散模型SSS和一个正整数kkk,IM从VVV选择一套kkk用户的S∗S^∗S∗作为种子集以最大化影响力传播σG,M(S∗)σ_{G,M}(S^*)σG,M​(S∗)。
直观地讲,影响力函数σ(⋅)σ(⋅)σ(⋅)在很大程度上取决于扩散过程。
给定:
- 定向社交网络
- 与边缘相关联的一组权重,代表用户之间影响的强度或概率
- 一个随机影响传播模型,用于控制某种行为将如何在用户中扩散
- 基数约束k,用于识别k个节点的集合,称为“种子集”,可以有针对性地最大化受影响的节点的预期数量

2.3. 扩散模型

通用扩散框架:框架关联每个用户u¨∈Vü∈Vu¨∈V状态为无效或活跃。然后,基于社交图GGG,它考虑了用户之间的以下传播过程。最初,一组选定用户(称为种子集 S⊆VS⊆VS⊆V)处于活动状态,而其他用户在VVV中不活跃。然后,考虑种子用户SSS所处的扩散过程可以“影响”其邻居以使其活跃,新激活的用户可以进一步激活其邻居,依此类推。当没有新用户可以激活时,此传播过程终止。特别是,该框架将上述“激活”建模为一个随机过程,影响力在不断扩大。然后定义影响力传播σ(S)σ(S)σ(S)为在扩散过程终止后具有活动状态的预期用户数。

在此调查中,我们关注渐进式扩散模型,即,由于大多数IM算法都考虑了渐进式模型,因此不能在以后的步骤中停用已激活的节点。也存在非渐进式扩散模型,即可以在非渐进模型中停用激活的节点。典型的非渐进式扩散模型是SIR/SIS模型和Voter模型。

2.3.1. 代表性模型

  • 独立级联(IC)模型
  • 线性阈值(LT)模型
  • 触发(TR)模型
  • 时间感知模型

区别:采用不同的机制来捕获用户如何切换其状态从非活动状态到活跃的,这是由它的邻居的影响。

2.4. 挑战

- 如何对社交网络中的信息传播过程进行建模,这将严重影响IM中任何种子集的影响传播。
- 获得IM的最佳解是NP-hard。
- 由于信息传播的随机性,即使对任何单个种子集的影响传播进行评估也是计算复杂的。
- 要检索(接近)最佳种子集并同时缩放到庞大的社交图非常具有挑战性。
- 解决上下文感知的影响最大化问题会带来许多技术挑战:将IM与各种环境(例如位置,时间和主题)结合提供了机会信息,以提高IM的有效性。

2.5. 框架

3. 影响力最大化的主要算法

尽管IM问题通常在计算上很复杂,但是当影响力函数σ(⋅)σ(⋅)σ(⋅)满足单调性和亚模态时,可以估计出最佳解。(monotonicity and submodularity)
IC,LT,TR和CT模型下的影响函数是单调和亚模的。 尽管IM的最佳解决方案很难解决,仍旧可以利用单调性和亚模性以理论上的合理性为IM提供有效的近似解决方案。

3.1. 贪婪框架

现有的大多数IM算法都采用简单的贪婪框架。使用空种子集初始化该SSS,并反复选择一个节点u¨üu¨进入SSS,如果u¨üu¨为影响函数提供最大的边际收益 。当存在kkk个不同节点在SSS时,算法终止。

3.2. 现有IM算法的分类和比较

尽管前面提到的贪婪框架具有很好的近似比率,即时通讯仍然很难解决,因为评估σ(⋅)σ(⋅)σ(⋅)仍旧是#P-hard问题。

3.2.1. 基于仿真的方法:模型通用性

关键思想:执行蒙特卡洛(MC)仿真以评估影响力分布σ(S)σ (S)σ(S)任何种子集SSS。
优点:具有模型通用性的优点。换句话说,通过插入特定于模型的MC仿真模块来评估影响,它可以轻松地合并任何扩散模型。此外,该方法具有良好的理论特性,如果基础影响函数是单调和亚模的,则通常返回具有恒定有界比的解。
缺点:计算效率 。此方法必须生成许多样本实例才能获得对σ(⋅)σ(⋅)σ(⋅)误差很小,这会导致大量的计算开销。

3.2.2. 基于代理的方法:实际效率

关键思想:设计代理模型来近似影响函数σ(S)σ(S)σ(S)克服#P-hard。从理论上讲,评估σ(S)σ(S)σ(S)是复杂的,因为SSS可能会通过图中的大量路径潜在地影响其他用户。但是,这种方法认为,可以将复杂的影响力模型有效地简化为代理模型,例如PageRank或最短路径。
优点:实用高效。例如,仅考虑最短路径,对σ(S)σ(S)σ(S)是多项式的而不是#P-hard。这种方法中的许多算法都显示了基于代理的方法的经验效率优势。
缺点:尽管基于代理的方法通常可以提高实践效率,但是它缺乏理论上的保证。已经表明,在某些情况下,基于代理的方法是不稳定的(最佳种子集和相应的影响可能会随着基础图的微小变化而急剧变化)。由于基于代理的解决方案通常对不稳定的情况不敏感,因此它们可能是任意坏的。

3.3.3. 基于草图的方法:理论效率

关键思想:设计一种在理论上有效的解决方案(而不是仅实际有效的方案),该解决方案还保持恒定的近似比率,从而克服了上述两种方法的缺点。例如,获得解决方案的预期时间复杂度与具有恒定逼近率的输入图的大小几乎呈线性关系。这种方法的想法是首先在扩散模型下构建理论基础的草图。然后,该方法基于构造的草图加快了评估速度,以评估影响函数。
优点:理论结果,即,它是具有严格约束解决方案和经验证的低​​时间复杂度的最理论上有效的算法。
缺点:构造的草图必须与基础扩散模型对齐。因此,与基于仿真的方法相比,该方法的理论结果不适用于更大范围的扩散模型。另外,基于草图的方法的实际效率可能比基于代理的方法的实际效率差,因为它需要确保最坏情况下的近似率。

3.3.4. 比较表格


上表. 经典扩散模型下影响最大化算法的比较

  • 从第3列到第6列,指出比较的算法是否支持不同的扩散模型(“✓”表示支持,“✗”表示不支持,“?”表示可能支持,但没有明确说明)。
  • 在第7列和第8列中,分别给出了算法的预期和/或最坏情况下的复杂度。
  • 在第9列中,声明了IM的算法的近似比率(不保证近似比率的“ NA”;对于基于代理的算法,给定的近似比率适用于其代理模型)。

4. 相关代码

  1. Ç. Aslay, N. Barbieri, F. Bonchi and R. A. Baeza-Yates, “Online topic-aware influence maximization queries”, Proc. Extending Database Technol., pp. 295-306, 2014.
    代码:C语言
  2. D. Kempe, J. Kleinberg and E. Tardos, “Maximizing the spread of influence through a social network”, Proc. 9th ACM SIGKDD Int. Conf. Knowl. Discovery Data Mining, pp. 137-146, 2003.
    代码:Julia
  3. Y. Tang, Y. Shi and X. Xiao, “Influence maximization in near-linear time: A martingale approach”, Proc. ACM SIGMOD Int. Conf. Manage. Data, pp. 1539-1554, 2015.
    代码:Scala
  4. A. Goyal, F. Bonchi and L. V. S. Lakshmanan, “Learning influence probabilities in social networks”, Proc. 3rd ACM Int. Conf. Web Search Data Mining, pp. 241-250, 2010.
    代码:Python
  5. Content-based Network Influence Probabilities: Extraction and Application
    代码:Python
  6. A. Goyal, W. Lu and L. V. S. Lakshmanan, “Simpath: An efficient algorithm for influence maximization under the linear threshold model”, Proc. IEEE 11th Int. Conf. Data Mining, pp. 211-220, 2011.
    代码:C++
  7. X. He and D. Kempe, “Stability of influence maximization”, pp. 1256-1265.
    代码:C++, Python, MATLAB
  8. N. Ohsaka, T. Akiba, Y. Yoshida and K.-I. Kawarabayashi, “Fast and accurate influence maximization on large networks with pruned monte-carlo simulations”, Proc. 28th AAAI Conf. Artif. Intell., pp. 138-144, 2014.
    代码:C++
  9. S. Lei, S. Maniu, L. Mo, R. Cheng and P. Senellart, “Online influence maximization”, Proc. 21th ACM SIGKDD Int. Conf. Knowl. Discovery Data Mining, pp. 645-654, 2015.
    代码:C++, Python
    10.Jing Tang, Xueyan Tang, Xiaokui Xiao, Junsong Yuan, “Online Processing Algorithms for Influence Maximization,” in Proc. ACM SIGMOD, 2018.
    代码:C++, C
  10. A. O. Saritac, A. Karakurt and C. Tekin, “Online contextual influence maximization in social networks”, in Proc. 54th Allerton Conference, September 2016, Monticello, Illinois.
    代码:Python, C, C++
  11. Online content-aware influence maximization
    代码:Python
  12. Online Influence Maximization with Local Observations
    代码:Python
  13. X. He and D. Kempe, “Robust influence maximization”, Proc. ACM SIGKDD Int. Conf. Knowl. Discovery Data Mining, pp. 885-894, 2016.
    代码:Python
    类似的关于Robust的代码:

    • Evaluate-the-Robustness-of-Influence-Maximization-Against-Edge-Uncertainty,上海交通大学项目Python
    • Package for solving a robust version of the influence maximization problem.Python
  14. A. Gionis, E. Terzi and P. Tsaparas, “Opinion maximization in social networks”, Proc. SIAM Int Conf Data Mining, pp. 387-395, 2013.
    代码:MATLAB
    类似的关于Opinion maximization的代码:

    • Maximizing Contrasting Opinions in Signed Social NetworksPython
  15. 未知论文:Influence-propagation-over-social-network
    代码:Java

在线社交网络的影响力最大化算法相关推荐

  1. 影响力最大化算法——MIA算法python复现

    MIA算法原文:Chen W ,  Wang C ,  Wang Y . Scalable Influence Maximization for Prevalent Viral Marketing i ...

  2. 会议笔记_一种带时间约束的影响力最大化算法

    引入时间因素 节点或者人在不同时间影响其他节点的属性不同 两个创新点: 最早激活时间:超过时间约束不会被激活 累计传播延时:激活一个节点需要多少时间 种子选择方法(三步): 第一步·设计包含时间约束的 ...

  3. 社交网络中基于位置的影响力最大化 CIKM2015 译文

    社交网络中基于位置的影响力最大化 摘要 这篇文章的目的是通过研究在LBSN平台中基于位置的影响最大化来实现O2O模式上的产品推广.随着O2O环境下存在的消费行为,传统的线上影响力扩散模型不能准确描述产 ...

  4. Information Sciences 2022 | 利用图嵌入和图神经网络实现社交网络中的影响力最大化

    目录 前言 1. 影响力最大化 2. SGNN 2.1 标签生成 2.2 struc2vec 2.3 GNN特征处理 2.4 回归预测 2.5 整体框架 3. 实验 3.1 数据集 3.2 评价指标 ...

  5. 【转】如何从计算视角研究网络传播影响力最大化问题?

    电商中对社交网络的两个应用方向,基于社交网络做推荐和基于社交网络做裂变广告.有意思的是做电商的往往做不起社交,电商和社交数据很难打通,而不管做推荐还是做广告,所有的建模和分析都是基于用户行为数据的,不 ...

  6. 在线社交网络影响力分析——总结

    社交影响力可以通过用户之间的社交活动体现出来,表现为用户的行为和思想等受他人影响发生改变的现象.在线社交网络影响力分析主要涉及三方面的内容:1.影响力自身的识别,如何从繁杂的因素中鉴别影响力和相关要素 ...

  7. 一种有效的基于路径的社交网络影响力最大化方法【论文阅读】

    文章目录 一.论文的亮点 二.HIPA算法具体过程 三.论文的优缺点 四.自己的收获点 五.未来可能的突破点 [摘要]本文是关于影响力最大化相关内容:内容的是关于论文An efficient path ...

  8. 干货!网络推断与数据驱动的影响力最大化问题

    点击蓝字 关注我们 AI TIME欢迎每一位AI爱好者的加入! 影响力最大化是指在社交网络中选择少量种子节点,以最大限度地扩大这些种子的影响力,这在过去二十年中已经得到了广泛的研究.在规范环境中,整个 ...

  9. 【EM算法】期望最大化算法

    [摘要] EM(Expectation-Maximum)算法也称期望最大化算法,曾入选"数据挖掘十大算法"中,可见EM算法在机器学习.数据挖掘中的影响力.EM算法是最常见的隐变量估 ...

  10. [INFOCOM 2019] NeuralWalk:使用神经网络的在线社交网络中的信任评估

    NeuralWalk: Trust Assessment in Online Social Networks with Neural Networks | IEEE Conference Public ...

最新文章

  1. linux网络管理三剑客
  2. 几个判断时不变系统的精彩例子
  3. python教学在线观看-python在线学习
  4. SD卡格式化怎么恢复?只需要五个步骤
  5. ios添加设备真机测试,以及Undefined symbols for architecture x86_64:''错误
  6. Advanced Science|北京大学第一医院肾脏内科杨莉团队与白凡研究组揭示急性肾损伤中始动和放大炎症巨噬细胞新亚群...
  7. window.location.href如何多次请求_何为幂等?如何设计?
  8. anroid抓包工具tcpdump的用法
  9. [USACO5.3]Big Barn (动态规划)
  10. 大数据分析平台的组成部分有哪些
  11. Camera--V4L2驱动学习记录
  12. Tensorflow从开始到放弃(技术篇)
  13. 黑苹果之技嘉(GIGABYTE)主板BIOS设置篇
  14. iPhone开发入门(一)
  15. 触宝发布2018年第四季度财报 净收入增长147%
  16. win10支持8t 硬盘_教你如何解决win10系统识别不了移动硬盘?
  17. 手把手教你Android来去电通话自动录音的方法
  18. 电信天翼云服务器性能,中国电信天翼云获可信云云主机“五星+”级别认证
  19. 路漫漫远修兮-centos7 oracle 11g 静默安装教程
  20. nalu模式多slice_H.264中NAL、Slice与frame意思及相互关系

热门文章

  1. 【中间件技术】第四部分 Web Service规范(10) Web Service规范
  2. nas918+支持的cpu_C2000浮点运算注意事项——CPU和CLA的差异及误差处理技巧
  3. 《我的世界》Minecraft私服搭建100%成功
  4. 【软件工具】之 TotalCommander
  5. TOM邮箱|163邮箱如何注册?怎么登陆?
  6. 反思-我们真的初老了么?
  7. hosts文件是什么? 以及在各个系统中(Windows、Mac、Linux)的hosts文件在哪里?
  8. 【无标题】输入圆锥体半径r以及高度h,并计算它的体积。
  9. 方维直播最新版服务端网站搭建3.1--1
  10. client-error-not-possible Ubuntu连接局域网打印机