含义:

在完成了某预定任务目标的人群中,分析他们都是因为什么原因而完成的

归因策略:

首次触点归因:待归因事件中,最早发生的事,被认为是导致业务结果的唯一因素

末次触点归因:待归因事件中,最近发生的事,被任务是导致业务结果的唯一因素

线性归因:待归因事件中,每一个事件都被任务对业务结果产生了影响,影响力平均分摊

时间衰减归因:越近发生的待归因事件,对业务结果的影响力

位置归因:定义一个规则,比如最早,最晚事件占一部分比例,中间事件平摊影响力

中间表设计:

技术手段:

归因权重计算逻辑复杂,用sql实现麻烦,不直观

使用SparkSQL可以将SQL和api混编,非常灵活,更加直观

计算逻辑:

1.先找出做过目标事件的用户

2.再从事件明细表中过滤出这些用户所发生的模型关心的事件记录

3.将事件记录数据按照用户分组

4.对每个用户的事件序列,按目标事件为分界点,切分成多段(因为一个用户可能做过多次目标事件)

5.对每一段按照归因策略算法打分即可

数仓建模主题--事件归因分析主题相关推荐

  1. 数仓 DW层 用户留存分析主题

    数仓 DW层 用户留存分析主题 1. 背景 在app运营和产品设计中,一般都是拉新和留存2个最关键指标来衡量对用户的吸引力程度. 拉新,顾名思义, 拉新用户进来 留存,顾名思义,让用户留下来,这里面有 ...

  2. 数仓建模—数仓架构发展史(02)

    发展史 时代的变迁,生死的轮回,历史长河滔滔,没有什么是永恒的,只有变化才是不变的,技术亦是如此,当你选择互联网的那一刻,你就相当于乘坐了一个滚滚向前的时代列车,开往未知的方向,不论什么样的技术架构只 ...

  3. 数仓建模(维度建模)

    目录 一.什么是建模?(为什么建模) 二.模型的好处 三.建模的方法 四.维度建模 4.1 基本概念 4.2 为啥选择维度建模(优缺点) 4.2.1 优点 4.2.2 缺点 4.3 维度建模-星型模型 ...

  4. 数仓建模—分层建设理论(03)

    文章目录 分层建设理论 分层的意义 清晰数据结构体系 数据血缘追踪 减少重复开发和资源浪费 复杂问题简单化 统一数据口径 提高数据质量 关于分层的一点思考 数仓的分层 ods 操作数据层 设计原则 D ...

  5. 离线数仓(三)数仓建模基本理论

    1.建模目标 数据模型就是数据组织和存储方法,它强调从业务.数据存取和使用角度合理存储数据.Linux的创始人Torvalds有一段关于"什么才是优秀程序员"的话:"烂程 ...

  6. 大数据开发之数仓建模

    目录 简介 1.什么是数据模型? 2.为什么需要数据模型? 3.如何建设数据模型? 简介 每个行业都有自己的模型,但不难发现,在数据建模的方法上,它们都有着共通的基本特点. 文章主要分以下几个方面来简 ...

  7. 数仓建模 项目_音乐数据项目火力全开,技能双倍提升!

    ↑ 点击上方"尚学堂"关注我们 音乐数据中心数仓综合项目 1项目介绍 音乐数据中心项目是大型企业级综合数仓项目,此项目针对音乐数据进行分析,构建数据仓库,建立用户.机器.内容等主题 ...

  8. 数仓建模的edw_浅谈数仓分层和模型

    数仓分层 ODS层基础层-ODS(Operational Data Store-操作型数据存储):主要是未经过加⼯的原始数据 中间层-CDM\EDW(Enterprise Data Warehouse ...

  9. 数仓建模本质到底是什么?为什么维度建能模脱颖而出?

    作者基于多年的大数据处理经验,当前管理着100PB+数据仓库和2000+节点的集群.持续系统化给大家分享一下关于数据仓库建设的经验总结.本系列既有数据仓库的形而上学理论体系,也有结合公司业务的实践,既 ...

最新文章

  1. 下一个10年,解决问题靠“大脑”
  2. [jQuery]使用jQuery.Validate进行客户端验证(高级篇-下)——不使用微软验证控件的理由...
  3. Visual Entity 下载列表(最新版为 2.0.0 ,已支持Visual Studio 2013)
  4. Linux系统编程@文件操作(一)
  5. CVE-2010-2883 从漏洞分析到样本分析
  6. 爬虫之Selenium
  7. 【RK PX30】 瑞芯微四核64位工业级芯片PX30 | 安卓核心板
  8. mysql在线开启并行复制_mysql 5.7开启并行复制
  9. 广告行业一些常用物料的尺寸
  10. Android之XML序列化和解析
  11. 只因“薪水过高”!被欠薪三个月后遭解雇,程序员删库反击
  12. 基于VUE,VUX组件开发的网易新闻页面搭建过程
  13. 《穿越计算机的迷雾》第二版再版说明
  14. 5个常用的大数据可视化分析工具
  15. AI(人工智能)园区顶层设计方案(ppt)
  16. ES6 入门:let
  17. MySQL事务原子性、一致性和持久性以及回滚是如何实现的?
  18. linux 下动手实现bash -lR 命令
  19. 中国人的英文名和外国人的中文名
  20. 阿里云产品 系列(一)MaxCompute简介与使用--上

热门文章

  1. [附源码]java毕业设计健身房管理系统
  2. 如何在if语句中表示多个条件?
  3. react ssr原理
  4. syzkaller 源码阅读笔记2(syz-manager)
  5. 用c语言写心理测试,心理小测试题目及答案
  6. 今天发现百度地图街景拼接的一处BUG
  7. r4be和服务器主板稳定性,升级进化 华硕R4BE主板细节解析_华硕 Rampage IV Black Edition_主板评测-中关村在线...
  8. C语言实现KTV歌曲系统
  9. Carson带你学Android:这是一份全面详细的动画学习指南
  10. okhttp 服务器性能,OkHttp逐步深入