文末可下载网易严选演讲PDF完整版~

上至BAT,下到互联网初创公司,都面临羊毛党的威胁

产品总价值=活跃用户规模╳单个用户价值–异常用户损失

你知道吗,在你关注用户增长的同时,有一些黑产也在关注你。

在2018U-Time冬季巡回现场,网易风控算法专家周冬敏分享了用户增长的另一面,黑产/羊毛党的产业链运作模式,以及网易严选如何通过人机识别、异常群体识别、Graph算法框架等风控算法,识别和处理羊毛党。

希望周冬敏的分享,能让大家更多关注和行动起来,降低异常用户损失。

(16分19秒,演讲完整视频)

大家好,我是周冬敏,网易风控算法专家。刚才我同事李琪提到产品总价值=活跃用户的规模*单个用户的价值—异常用户损失,我接下来就从风控角度,分享异常用户损失这部分。

(李琪分享 深度干货| 网易严选的高段位数据运营法则)

——用户增长背后的灰产——

黑色产业链中影响最广是羊毛党。羊毛党往往手握重兵,掌握包括移动设备、手机账号等资源,在大家看起来非常小的利益点,比如优惠券、红包等经过羊毛党就会形成一大笔财富,他们掠夺这部分财富,让我们精心设计的营销活动毁于一旦。

羊毛党有多严重?举两个例子,《2015数据安全报告》指出优步中国订单中40%为虚假交易,优步回应称不到10%,我认为这是客观偏保守的数据,20亿市场补贴有10%,那就是将近2亿美金。

某直播平台被羊毛党包围并被薅羊毛上百万,直接就倒闭了。上到BAT下到互联网初创公司,都面临羊毛党的威胁,他们应对这种风险的能力偏弱,意识也偏弱。

更可怕的是,互联网发展到今天,黑色产业链经过几轮迭代,变成十分成熟的商业运作模式。它复杂、隐秘、高效,由众多背景的黑灰产业组合而成。

上游是基础性环节,承担挖掘、制作生产和服务职责,包括图形验证码平台,手机验证码平台及软件代理工具,还有账号注册需要的身份信息就是社工库。

中游是账号生产和销售,比如盗号团伙、垃圾号注册团伙、洗号团伙、账号交易平台。

下游就是利益套现,往往是用一批经过从上中游得到的账号进行抢利,在一些场景比如秒杀/红包、0元购、优惠券做资金归集,最终实现套现。

——如何识别异常账号——

追根溯源,黑产的根本目的是为了获取大量资金,所以他们一定会追求投资回报率,最大限度利用资源。比如一个账号、一个手机、一个设备,都需要投入费用。因此,他们所有行为都没有产生复杂的关联,普通账户往往是在操作地域、时间、账户关系上呈现离散、关联系数的结构特征,而羊毛党往往呈现出聚集性风险,所以我们需要加强识别的手段。

左上角是风险业务全链路,从注册登录一直到售后维权,业务的全链路就是风险的全链路,我们会根据不同的风险类型寻找重点的业务抓手,比如账户、登录和后续登陆、修改信息是需要重点防控。

防控获得数据的类型分为两种:

第一种是利用前台采集到的数据。

通过采集页面点击行为、鼠标行为做人机识别,基于风险产品比如NC验证码、身份验证手段进行风险消化。

第二种是基于业务数据做异常群组识别。

后端业务数据往往更加复杂、个性化。通过对后端业务数据的梳理,我们尝试构建风险图谱。图谱构建方法根据业务会有不同,在实践中,我们进行的尝试大体将其分为三块:

1)历史上账户存在的媒介关联。历史关系媒介包括例如用户-设备指纹、用户-手机关联等。

2)风险主体属性关联。比如通过账号模式、来源、渠道一样或者相似来构建这种关联。

3)基于事件行为的关联。我们正在探索同一类账户,在同一个异常的时间点,做了同一件事情,我们也会把它构建在网络里,构成风险图谱。

有了风险图谱,接着通过图算法对风险进行识别。比如图聚类、或者当前比较流行的图表示学习模型(network embedding)把图蕴含的信息进行表达输出,最后对输出的异常群组进行交易阻断、风险消化。

 

——严选的风控案例——

订单环节刷单识别与部署

下图是目前严选已部署的刷单识别模型,分为4个环节。前两个环节分别是离线用户媒介关系构建、实时用户关系构建。

首先是离线关系构建,是我们从历史用户媒介关联的最底层数据里解析出用户-媒介关联,进而形成用户间的关系投影。接着是实时关系构建。通过实时事件的接入,构建短期实时关系网络,这个关联着重聚焦在72小时内产生的订单之间账户属性、账户行为关联。最终这些关系类型叠加形成一个风险网络图谱。

当订单事件触发,我们会对近期的订单关系graph进行一次聚类操作。紧接着聚类过程,我们对异常群组的结果进行可视化展示、提供群组分析的相关模块、对风险进行人工确认交互。这些模块主要是辅助群组风险进行应用落地。实时图聚类处于对资源的考虑,可以数秒钟(比如10秒)触发一次。

最后进入风险处置,根据前面的结果进行交易阻断或落到名单库里进行下一次的风险预测。

下面展示两个异常群组,下边这个图是我们根据近两天的订单聚出来的第一个群组,节点上显示全部是0元单,注册时间是当月,关联原因是因为节点之间存在历史的媒介关联,72小时的IP关联,72小时的地址关联。

图中节点代表的一些订单,在手机、IP、地址方面,都绕过风控规则行为,比如一个手机就下两单,刚好不满足我们风控抓取的阈值;比如一个IP只下五六单就把我们策略略过了;地址写的非常乱,其实都是同一个地址,当然这部分我们用文本识别模型加以识别。如果用单点识别方法,这些订单都会通过,但是我们用了这套图聚类算法,通过手机号、IP、地址的规则防控,风险最终通过网络聚合并展现出来。

如果我们把这个群组里的订单,放到历史数据里去看,得到更加全面的结果,红色大点表示我们刚提到的异常群组A。可以看到这个异常群组是处于一个更大的历史网络里。

就像友盟+同学所分享的,基于AI和全域数据能力,我们不仅可以更加深度的分析用户行为、预测用户价值,更可以构建风控体系,让用户行为数据增值增厚,最终实现高质量的用户增长。

以上就是我的分享。

下载演讲PDF完整版

——U-App AI版抢先用——

升级数据运营思路,更需要升级数据运营工具,了解U-App AI版:

U-App AI版核心能力

智能拉新:人群策略、媒体策略,投放优化

日常监测:自制看板、行业对比、整体趋势

精细分析:事件细分、漏斗分析、自定义留存

用户洞察:用户分群、用户画像、用户分析

用户管理:生命周期运营/预测价值/预警流失

用户触达:分群PUSH,系统级下发通道

 ——活动报名+直播通道——

U-Time极速报名通道

↑扫一扫或识别二维码报名

(可能需要复制链接,在浏览器中报名)

点击 “ 阅读原文 ” ,同样可以抢位。

你关注过黑产、羊毛党吗?用户增长的另一面相关推荐

  1. 风控人不能不知的黑产大揭秘

    大数据黑产(以下简称"黑产"),指的是盗取.贩卖个人信息,通过掌握个人信息进行精准非法牟利.在信贷业务中,黑灰产基于非正常的资源/手段(IP.手机号.身份信息等),通过正常的产品流 ...

  2. “购物狂欢节”如何应对“羊毛党”

    基于用户画像大数据的电商防刷架构 作者:颜国平 转自:https://cloud.tencent.com/developer/article/1006271 摘要:最近几年,电商行业飞速发展,各种创业 ...

  3. 黑产以及一般业务安全的应对思路

    业务安全顾名思义是与业务紧密联系的,企业常见的业务场景有账号安全.活动安全.账户安全.交易安全.内容安全等,每种场景可能遇到不同类型的威胁,如虚假注册.撞库.盗号等等. 业务安全的目标是识别业务访问为 ...

  4. vivo 游戏黑产反作弊实践

    作者:vivo 互联网安全团队 - Cai Yifan 在数字化.移动化的浪潮下,游戏产业迅速发展,尤其疫情过后许多游戏公司业务迎来新的增长点. 游戏行业从端游开始一直是黑灰产活跃的重要场景.近年来, ...

  5. 大数据技术如何有效阻击网络黑产?

    最近,互联网行业的"网络安全"事件频发.仅8月就发生了多起网络黑产攻击事件,包括国内某重要通信企业多地子公司遭遇Globelmposter勒索病毒攻击.华住集团被曝旗下酒店约5亿条 ...

  6. 薅一天吃一年?!揭秘京东数科11.11背后的反黑产“暗战”

    在某电商平台购物节期间,大二学生晓敏凌晨3点被一串"夺命连环call"震醒,拿起手机后,他瞬间清醒,这个"羊毛"必须得薅! 信息提示,该平台出现一个巨大漏洞,用 ...

  7. 2018智能反欺诈洞察报告:黑中介、黑产智能化趋势明显

    80.90一代成诈骗重点目标,男性易受骗且损失数额大 报告数据显示,2018年360手机卫士手机先赔接到的诈骗举报投诉案件中,金融诈骗损失金额占比高达35%,报案量在全部诈骗类型中占比14.9%.报告 ...

  8. 游戏公司如何应对游戏黑产 ?

    导语 在手机游戏蓬勃发展之际,很多优秀的游戏在口碑和收入上都取得了耀眼的成绩. 但是,另外一股暗流也在飞速发展,他们偷偷侵蚀着游戏的经济生态,并且给游戏造成了巨大的经济和口碑损失.他们利用各种手段获取 ...

  9. 机器学习 day5 day6 分类问题实战:判断是否为羊毛党

    判断是否为羊毛党 合并用户表和现金表,过滤掉没有钱包事件的用户 合并总表 取出有用的列 修正时间格式 将表分开成羊毛党用户(invalid)的行为和非羊毛用户(valid)的行为 数据探索 同pare ...

最新文章

  1. Rhel6.0部署Oracle10g报错相关问题记录
  2. UVA 10603 Fill
  3. [ORACLE错误]oracle 不能更新 PL/SQL 点击“edit data”报“ these query results are not updateable”...
  4. 全面容器化之后,来电科技如何实现微服务治理?
  5. “象征界”的奇观:刘天怜花鸟工笔作品印象
  6. rocketmq 初探(四)
  7. linux messages 时间错乱_BATJ 常考的 21 条 Linux 命令,速度收藏!
  8. Linux 170个常见问题的详细解答
  9. 提前还贷的python计算程序
  10. python嵌套字典的建立_python学习之第八篇——字典嵌套之字典中嵌套字典
  11. mysql中常用的筛查语句_数据库中常用的一些关键字
  12. 多所985、211高校教授被通报!国自然发布处理决定!
  13. 软件无线电(SDR)及高频/高速(RF/Hi-Speed)标准集
  14. python绝对值编程_python求绝对值的三种方法小结
  15. POJ3080 基本字符串库函数的应用 ..Brute Force/朴素模式匹配算法
  16. 什么是动态DNS(DDNS)
  17. Zotero 5.0 + 坚果云同步盘 + papership 配置教程
  18. 饿了么为啥给你推荐这个?本地生活搜索算法解密
  19. 自己开发基于Web的打印控件,真正免费不是共享
  20. 国网云(华为组件)使用

热门文章

  1. 如何用计算机寒假计划表,2018寒假计划表怎么做
  2. vue 水波纹指令_纹波效应作为Vue指令
  3. 盐城大数据提“颜值”增“气质”
  4. GANSS GS87C 高斯机械键盘Linux下不适配
  5. 主管与人相处的十二条准则[转]
  6. java练习 车费问题
  7. 《SolidWorks 2012中文版从入门到精通》一6.2 查询
  8. Springboot 报错Content type ‘application/x-www-form-urlencoded;charset=UTF-8‘ not supported
  9. 【一篇看全】工业相机常用数据传输协议速率对比(CameraLink,CXP,1/10/100GigE,USB)
  10. 马天宇现场助阵,TCL冰箱洗衣机品牌战略升级