大数据学习——常用的数据分析法和模型
产品的基本数据指标
- 新增:日新增、月新增
- 活跃:如日活跃(DAU)、月活跃(MAU)等
- 留存率:用户会在多长时间内使用产品,如:次日留存率、周留存率等
- 传播:平均每位老用户会带来几位新用户
- 流失率:一段时间内流失的用户,占这段时间内活跃用户数的比例
- 地域分布
- 使用时长分布
常见的数据分析法和模型
直方图(频率分布)分析
将某参量的数值范围等分为若干区间,统计该参量在各个区间上出现的频率,并用矩形条的长度表示频率的大小。
箱线图(数据分布)分析
箱线图(Boxplot)也称箱须图(Box-whisker Plot),是利用数据中的五个统计量:最小值、第一四分位数、中位数、第三四分位数与最大值来描述数据的一种方法,它也可以粗略地看出数据是否具有有对称性,分布的分散程度等信息,特别可以用于对几个样本的比较。
时间序列图(趋势)分析
描述流程特性值在一段时间内变化波动的趋势和规律的统计工具,如整个流程大体在什么范围内运行、是否具有波动较大的时期或时点等。
散点图(相关性及数据分布)分析
散点图(scatter diagram),在回归分析中,数据点在直角坐标系平面上的分布图。
散点图表示因变量随自变量而变化的大致趋势,据此可以选择合适的函数对数据点进行拟合。
百科对此有更详细解释:
百科链接
示例:
对比图分析(差异分析)
对比分析就是将两个或两个以上的数据进行比较,分析它们之间的差异,从而揭示这些数据所代表事物的发展变化情况和规律。通过对比,可以很直观地看出事物在某方面的差距,并且可以准确、量化地表示出差距的多少。
实际使用中使用简单的柱状图可进行对比图分析。
算术平均分析(差异分析)
运用计算平均数的方法反应总体在一段时间、地点条件下,某一数量特征的一般水平。平均指标既可用于同一现象在不同地区、不同部门间的横向比较,也可用于同一现象在不同时间的对比。
移动平均分析(趋势分析)
趋势平均法是指以最近若干时期的平均值为基础,来计算预测期预期值的一种方法。趋势平均法指在移动平均法计算n期时间序列移动平均值的基础上,进一步计算趋势值的移动平均值,进而利用特定基期销售量移动平均值和趋势值移动平均值来预测未来销售量的一种方法。
漏斗图分析(差异分析)
漏斗图适用于业务流程比较规范、周期长、环节多的流程分析,通过漏斗各环节业务数据的比较,能够直观地发现和说明问题。
在网站分析中,通常用于转化率比较。
示例:
本文参考:
http://blog.csdn.net/zhanghongju/article/details/18901857
http://item.jd.com/11295690.html
大数据学习——常用的数据分析法和模型相关推荐
- 大数据学习之经典数据分析算法详解
在大数据行业,懂算法的大数据工程师是非常有核心竞争力的,之前科多大数据的一位培训学员面试之后,回来和我们分享,懂得算法在面试过程中是非常加分的,即便算法的底层逻辑不是很了解,但一定要懂得具体应用,本文 ...
- 收藏 | 100+篇大数据学习资讯,带你玩转大数据分析!
2019独角兽企业重金招聘Python工程师标准>>> 深度解析如何挑选适合自己的Hadoop平台 什么是Hadoop,怎样学习Hadoop 分布式文件系统HDFS解析 Hadoop ...
- java 与大数据学习较好的网站
C# C#中 Thread,Task,Async/Await,IAsyncResult 的那些事儿! https://www.cnblogs.com/doforfuture/p/6293926.htm ...
- 大数据学习笔记:Hadoop生态系统
文章目录 一.Hadoop是什么 二.Hadoop生态系统图 三.Hadoop生态圈常用组件 (一)Hadoop (二)HDFS (三)MapReduce (四)Hive (五)Hbase (六)Zo ...
- 零基础大数据学习框架
大数据开发最核心的课程就是Hadoop框架,几乎可以说Hadoop就是大数据开发.这个框架就类似于Java应用开发的SSH/SSM框架,都是Apache基金会或者其他Java开源社区团体的能人牛人开发 ...
- 大数据学习路线2019版(附全套视频教程及网盘下载)
什么是大数据? 大数据(BIG DATA)是指无法在一定时间范围内用常规软件工具进行捕捉.管理和处理的数据集合,是需要新处理模式才能具有更强的决策力.洞察发现力和流程优化能力的海量.高增长率和多样化的 ...
- 零基础转行大数据怎么学习?大数据学习路线
大数据要怎么学,本文来说说到底要怎么学习它,以及怎么避免大数据学习的误区,以供参考.数据科学特点与大数据学习误区 (1)大数据学习要业务驱动,不要技术驱动:数据科学的核心能力是解决问题. 大数据的核心 ...
- 史上最全大数据学习资源整理
史上最全大数据学习资源整理 ----------------------------------------------------------------------------------- 转载 ...
- 最全大数据学习资源整理
关系数据库管理系统(RDBMS) MySQL:世界最流行的开源数据库; PostgreSQL:世界最先进的开源数据库; Oracle 数据库:对象-关系型数据库管理系统. 框架 Apache Hado ...
最新文章
- 呼叫中心的服务水平管理
- PCL1.8.1安装和一些小错误
- 菜鸟学Java(十一)——GET与POST
- python里有常量吗?(没有,但可自行定义)
- C++ Opengl纹理贴图源码
- 2019.3.18 区块链论文翻译
- Owner Useful links
- Linux多线程——使用信号量同步线程
- 作者:刘玮(1977-),男,中国科学院计算技术研究所网络数据中心、烟台中科网络技术研究所工程师。...
- 提高程序员工作效率的几大工具
- angularjs -- 监听angularJs列表数据是否渲染完毕
- 【Oracle】闪回技术
- excel分段函数c语言,实战:Excel 逻辑分段函数应用
- 查看各大网站服务器操作系统
- 7-5 厘米换算英尺英寸
- 剑指offer算法题028:数组中出现次数超过一半的数字
- C++ Programming Basic acknowledge
- Eclipse中快捷键Ctrl + Alt + 向上箭头 或者 Ctrl + Alt + 向下箭头与Windows冲突
- 从0到1搭建电商营销数据分析平台(六)——聊聊反作弊
- 20201102 门面设计模式
热门文章
- FAR PASCAL 的解释
- 里氏代换原则 (Liskov Substitution Principle, LSP)
- 线阵ccd模块LCAMV8-S11639-01/S11638高灵敏线阵图像传感器模组、驱动板
- asp毕业设计——基于asp+access的订单管理系统设计与实现(毕业论文+程序源码)——订单管理系统
- 光年(Light Year Admin)后台管理系统模板
- 2021年上海第一批高新技术企业上海熙有网络科技集团榜上有名
- Leetcode_202_Happy Number
- 开源正弦波20kHz信号发生器 V2
- KVM和Xen的区别
- 有趣的Unicode字符