项目一 B站会员购订单数据分析

  • 1、bilibili会员购平台业务背景介绍
  • 2、平台相关数据介绍
  • 3、订单数据的数据分析方法
    • (1)订单数据的数据分析思路
    • (2)相关python知识点讲解
    • (3)b站会员购订单数据的宏观分类与分析思路
    • (4)b站会员购订单数据的微观分类与分析思路
      • ——订单量、订单额、客单价的统计分析(结合不同订单数据类型结合分析目的进行分析)
      • ——商品相关分析思路
    • (5)B站会员购订单数据多表格数据的汇总与分析
    • (6)B站会员购订单数据针对用户属性判别的分析
    • (7)针对地区品牌渗透度判别的分析
  • 项目总结——B站会员购订单数据分析
    • 背景
    • 任务
    • 行动
    • 结果

1、bilibili会员购平台业务背景介绍

  • 业务内容:B站自己的商业化业务板块,主要包括**商品(手办、周边)票务(漫展、赛事)**两大类
  • 业务逻辑:存在很多IP→IP衍生品→形成产业链(围绕IP做商品、展览,做推广、销售)和服务(ACG文化基础、更高的信息触达率、更高的用户信任度、经济规模优势)两个业务→给用户更多的价值感,提升作品影响力
  • 用户画像:与B站几乎一致,年轻人、男性、一二线城市
  • 内容标签:搞笑、日常、bilibili正版、电子竞技

2、平台相关数据介绍

商品编号(SKU)、商品名称、商品价格、票号(票务)、座位(票务)、联系地址、渠道(从哪个渠道下单买的,主页/搜索/测试渠道/广告/购物车/分类栏)、下单时间、支付时间、支付单号、店铺名称、店铺id、订单状态(待支付/已取消/待发货/售后状态/是否海外购/税费)

3、订单数据的数据分析方法

(1)订单数据的数据分析思路

①数据抓取(数据库数据调取)
②数据清洗(无效数据清洗、有效数据筛选)
③数据分析(用户属性判别、品牌渗透判别、订单时间/地区分布……)

(2)相关python知识点讲解

通常使用pandas包处理分析。
①数据读取(单个表格、多个表格读取)

 # 单表格读取
data = pd.read_excel('.xlsx')
data.head()
# 多表格读取
file_path = '数据路径'
file_list = os.listdir(file_path)
for orders in file_list:data = pd.read_excel(file_path + '\\' + ordersdata.head()

②数据处理(数据格式转换、数据清洗)
订单地区数据筛选,剔除“–”无效数据

data = dt[dt['联系地址']!='--']
data.rename(columns={'商品价格':'price','联系地址':'address})  #……

③数据分析(描述性分析、预测性分析、可视化分析)

# 描述性分析
df.describe()  # 各统计数值
df.hist(bins=20) # 直方图

(3)b站会员购订单数据的宏观分类与分析思路

①订单类型:
待支付(已经提交订单信息等待支付的订单)、已取消(被取消的订单,主动取消/支付超时被动取消)、待发货(已付款等待发货的订单)、待收货(已发货等待收货的订单)、已完成(完成所有订单环节的订单)
② 对取消订单针对性分析

  • 恶意订单占货分析(提交订单不付款,占库存)
    excel操作:
    巨额取消订单筛选,判断是否为恶意压货订单
    a. 筛选,订单状态,选择已取消,得到所有已取消的订单。
    b. 将商品价格降序,看是否有高价订单,注意联系地址的重复性、空地址(案例数据结果:有些订单金额特别高(其中很多没有地址),属于恶意订单,较低金额的属于比较正常的,但多个订单同一地址的也需要关注)
    c. 根据商品编号,找到订单具体数据,找到用户id,看这个用户过去的购买记录,如果经常存在敏感操作→封禁此账号
  • 剔除取消订单以确保订单数据(支付时间)的正确性(为后续的时间分布分析等服务)

(4)b站会员购订单数据的微观分类与分析思路

——订单量、订单额、客单价的统计分析(结合不同订单数据类型结合分析目的进行分析)

  • 按年、季度进行订单统计→分析行业/市场需求波动(淡季、旺季)
  • 按月进行订单统计→公司/部门业绩分析(根据不同阶段的业绩,提供对应优惠,促进购买)
  • 按小时进行订单统计→消费者/用户消费习惯分析
  • 按分钟/秒进行订单统计→促销/活动即时效果分析
    ① 订单时间分布分析
    有效下单时间筛选→小时+分钟数据筛选→小时+分钟订单统计
    excel操作:
    a. 全选下单时间,右键设置单元格格式,选择时间类型为全中文
    b. 选择下单时间列,插入数据透视表,确定,下单时间依次拖到行,值(计数项)
    c. 透视表中的数据,选择数据,插入柱状图,可加入数据标签(小时订单数统计)
    结果:晚8点为高峰期,凌晨1点-9点为低谷期,意外:晚10-12点属于高峰期
    d. 插入帕累托图
    80%的订单数来自于下午和深夜
    e. 插入订单量折线图,增加趋势线
    从0点到23点,订单量暴涨
    ② 订单价格分布分析
    按小时维度价格统计→按小时维度总订单额统计→按小时维度客单价统计

订单量分布、客单价分布
客单价变化、客单价交叉分析
excel操作:
a. 选中商品价格至下单时间列,插入数据透视表
b. 下单时间拖到行,将商品价格拖到值。插入柱状图,中午和下午两点、晚七点订单额较高
c. 将透视表的值调整为平均值。(设置数字格式保留1位小数)插入柱状图/折线图,增加数据标签
分析:客单价在凌晨4点、中午12点、中午、晚上10点11点高位,整体趋势逐步提升
③ 订单时间分布与价格分布的交叉分析
a. 订单量和订单额交叉分析
订单额:晚8点订单量最高,但订单额并不是最高,实际上晚8点订单额偏低
b. 订单量和客单价交叉分析
晚上8点:客单价低,订单量高
中午12点、晚上10点和晚上11点:客单价高、订单量高
c. 建议:
i. 晚上8点,消费人群主要是购买力不高的价格敏感性消费人群,可以发放一些优惠券或者开展促销活动;
ii. 晚上9点到晚上12点,增加广告的曝光量

——商品相关分析思路

①商品单维度分析
——分析不同商品的客单价分布

excel操作:
a. 商品编号+商品价格,插入数据透视表,商品编号拉到行,商品价格拉到值(求和项→平均值)。设置商品价格显示没有小数,按客单价降序排列
c. 选择客单价,插入柱状图(直方图的默认第一个),添加数据标签,得到客单价分布(箱的宽度可以自行设置)
分析:
[1,82]价格区间卖得最多,有部分商品非常昂贵,价格区间为[2350,2431],符合长尾分布的趋势
d. 选择客单价,插入直方图(直方图的默认第二个,排列图)——客单价帕累托分析
分析:对80%商品对应的价格进行关注——80%的商品价格在360以下。
e. 将透视表中的值由平均值变为计数,得到不同商品的销量。按照商品销量降序排列,插入折线图。
分析:符合长尾分布,头部商品卖得特别多,随着排序逐步提升,销量逐渐趋向于0,但下降速度减缓。
可以考虑进行排序和销量的回归分析。新建一列=LN(商品销量),双击填充列,得到LN销量列。对LN销量插入折线图,相比前一折线图而言更具有可预测性。
f. 选择商品销量,插入直方图。
帕累托分析:长尾分布在B站会员购商品中非常显著,大部分商品一天的销量在17件以下,但已经占了90%的分布.
②商品+时间双维度分析
不同商品一天24小时的订单数量统计
excel操作:
a. 选择商品编号+商品价格+下单时间等,插入数据透视表,将下单时间设置为行,商品编号设置为列,商品价格设置为值(计数项),得到每个商品在每个小时下单量
根据商品编号-销量表中销量前五名的商品编号,在数据透视表中搜索到该商品编号对应的列,将这些列筛选出来,复制到一个新表,将第一列列名设为小时,后面五列依次为销量前五名的商品编号。
全选数据,插入折线图(默认第一个),系列1-5对应销量排序1-5的商品,得到不同商品在24小时内的销量波动趋势。
分析:
大多数商品0点销量还不错,1~8低谷期,9-10点销量上升,11-19期间销量波动,有两个商品在晚8点为销量高峰,符合前述分析认知,晚9点后为正常高峰波动;有一款商品(销量第四)在11点开卖,迅速进入高峰,开始波动,晚6、7点有比较高的销量,但晚8点并不是较高的位置。
根据商品编号查看订单数据,查看对应的商品名称:销量排名前三的商品价格都比较低,只有十几块,销量比较高;排名第四的商品价格122,为一个限定限量福袋,中午12点开售,晚上停售。销量第五的商品销量相对较低,且波动不大,333元的价格偏贵,所以消费量比较低迷,但因为也是限定限量商品,所以销量也排到了前五。
③商品地区客单价分析
按商品价格和联系地址统计订单,得到不同地区的平均客单价
excel操作:
a.筛选联系地址为–的数据,把这些没有具体地址的数据删除;在剩下的数据中,新插入一列“1级地址”,第一行单元格输入=LEFT(联系地址列第一行单元格),双击填充剩余数据;选中商品价格+1级地址列,插入数据透视表,1级地址设为行,商品价格设为值(平均值项),改名为客单价并设置显示1位小数,按客单价降序排列;插入柱状图,得到不同地区客单价分布柱状图。
分析:
西藏的客单价特别高,但西藏的订单量特别少,所以是个特例,参考意义不大。
浙江客单价高,是个宝藏地区~
吉林客单价低~~

(5)B站会员购订单数据多表格数据的汇总与分析

汇总多订单表格数据后可以进行周订单波动分析、一周不同时间用户购物习惯差异分析……
方法:
①汇总周一到周日的订单数并求平均值
②选平均值最低的这一天,将权重指数设置为1
③将其他天的平均值除以平均值最低这天的平均值,得到对应的权重指数
④将7天的权重指数加起来得到周权重指数。周权重指数越与7的差距越大,波动越大,表明用户的消费习惯差距非常大,需要解决。

(6)B站会员购订单数据针对用户属性判别的分析

从订单量和客单价的时间分布,判断出主要用户——年轻人/晚睡晚起的互联网/新兴产业加班多的从业者

(7)针对地区品牌渗透度判别的分析

按联系地址统计订单数
excel操作:
a. 插入数据透视表,1级地址设为行,同时设为值(计数项),按订单数降序排列,插入柱状图。
b. 插入帕累托图,得到80%市场来自于哪些地区。
需要结合人口排名去分析品牌渗透度。通常人口多的地区订单数也就多,人口多而订单量少——品牌渗透度低。

注意:
用户画像相对于订单数据可视化更具有全面性。
分析用户画像的话,需要比较全面的数据。

  • 数据统计时间至少以季度为单位(淡旺季)
  • 数据统计商品至少以品类为单位(商品属性差异)
  • 数据统计用户至少以平台为单位(产品功能的使用局限性)

项目总结——B站会员购订单数据分析

背景

B站的会员购业务,产生了许多的订单数据,记录了交易涉及的用户、商品及订单信息。

任务

①分析是否存在恶意占货的订单,找出封禁敏感用户账号。
②统计分析订单,找到用户的消费行为习惯,进而进行精细化运营。

行动

①宏观角度,筛选已取消的订单,并按商品价格降序。将价格特高/无收货地址的已取消订单、同一地址的连续多个已取消订单初步视为恶意压货订单,根据这些订单的用户id查询其过去购买记录,如果经常存在此类操作,则视为恶意用户,需要封禁此账号。
②微观角度,从时间、地区两个维度对订单数据进行统计分析。在时间维度上,分析订单量、订单额和客单价在一天24小时的变化,得出下单量和客单价的分布情况,分析推测不同时间段的用户群体类别,进而在不同时间段开展针对性地营销操作。
③微观角度,从时间维度和地区维度统计商品的销量和客单价,根据商品销量排名和客单价分布情况,得出畅销商品的价格区间,以及高价值的地区(订单量与客单价高的地区),进而向特定地区开放特定价格的商品。
④微观角度,在地区维度上,对订单量进行统计通过帕累托分析得到订单的主要市场地区,与人口排名结合,通常人口多的省市订单量也就多,人口少而订单量高的品牌渗透度强,人口多而订单少的地区品牌渗透度低,需要关注。

结果

①分析结果显示确实存在一些恶意订单,但没有查询这些订单用户的历史购买记录。
②晚上8点,消费人群主要是购买力不高的价格敏感性消费人群,可以发放一些优惠券或者开展促销活动;晚上9点到晚上12点,增加广告的曝光量。
③热销的商品通常价格都比较低,但限时限量的商品价格稍微高一点销量也比较高,但过高的价格会影响销量。
④浙江地区的客单价高,人数少而订单数多,品牌渗透度高,是个高价值地区。

《十周成为数据分析师》笔记——业务线 第四节 电商平台订单报表分析相关推荐

  1. 《十周成为数据分析师》笔记——业务线 第五节 用户画像体系

    项目二 亚马逊平台入驻商订单报表分析 1.互联网电商平台入驻商数据分析的一般思路 (1)获取数据 (2)分析业务需求 (3)产生数据结果 2.亚马逊平台入驻商相关数据 3.入驻商用户画像体系介绍 (1 ...

  2. 大数据交易研究_学术著作 | 基于电商平台大数据的特征价格指数研究——统计研究...

    基于电商平台大数据的特征价格指数研究 作者:雷泽坤,辽宁大学经济学院,清华大学中国经济社会数据研究中心:郑正喜,上海财经大学统计与管理学院,清华大学中国经济社会数据研究中心:许宪春,清华大学中国经济社 ...

  3. 《十周成为数据分析师》笔记——业务线 第八节 常见互联网业务的数据分析报告的制作及用户分层模型

    互联网业务数据分析报告及用户分层模型 一.业务逻辑回顾及互联网相关指标 1.实战项目与业务逻辑回顾 数据报表(数据源)→用户画像(数据分析)→数据化运营(决策指导)→商业分析(宏观判断)→分析报告(结 ...

  4. 《十周成为数据分析师》笔记——业务线 第三节 不做只懂技术不懂业务的“工具人”

    项目案例 bilibili站内CPC广告优化 1.bilibili广告系统相关背景及数据介绍 2.CPC广告投放系统的要素介绍--广告投放营销漏斗转化模型 (1)曝光量(展示量)涉及要素 (2)点击量 ...

  5. 《十周成为数据分析师》笔记——业务线 第六节 以数据分析为导向的运营体系搭建

    项目三 以数据分析为导向的运营体系搭建 1.流量运营案例:如何用数据分析的思路解决广告优化问题 (1)电商入驻商广告业务简介及传统分析链路数据分析 (2)漏斗模型的搭建与入驻商相关广告应用 (3)多广 ...

  6. 10周拿下数据分析师认证

    真诚的向大家推荐,<腾讯课堂数据分析师认证课程>,该课程也是腾讯课堂指定认证课程.专为在校学生.0~3年职场新人量身定制,真正体系化.专业化帮大家提升数据分析能力,成为大厂抢手的数据分析人 ...

  7. 10周成为数据分析师!

    真诚的向大家推荐,<腾讯课堂数据分析师认证课程>,该课程也是腾讯课堂指定认证课程.专为在校学生.0~3年职场新人量身定制,真正体系化.专业化帮大家提升数据分析能力,成为大厂抢手的数据分析人 ...

  8. 电商平台销售数据评测智能手表|数据分享

    " 智能手机的笨拙已经不能满足消费者解放双手的需求.因此,便于携带的智能手表受到了消费者的青睐,而技术的不断创新也使得智能手表的功能越来越强大,转变甚至取代了智能手机的功能. " ...

  9. [学习笔记]B站视频:磨剑之作,七周成“师”!【七周成为数据分析师】- 第一周

    [学习笔记]B站学习视频:七周成为数据分析师-第一周 序 数据思维 结构化 公式化 业务化 数据分析的思维技巧 象限法 多维法 假设法 指数法 二八法 对比法 漏斗法 如何在业务时间锻炼数据分析思维 ...

最新文章

  1. 220V黄金光的LED灯带测试与结构
  2. disruptor框架为什么不流行_Java并发编程框架Disruptor
  3. 如何禁止使用本地administrator进行共享连接
  4. (转载)[MySQL技巧]INSERT INTO… ON DUPLICATE KEY UPDATE
  5. Github 大牛封装 Python 代码,实现自动发送邮件只需三行代码
  6. Filter_细节_web.xml配置方式
  7. C#中ref与out区别
  8. java字符串拼接_字符串拼接,什么时候会走StringBuilder?
  9. Android开发笔记(一百六十)休眠模式下的定时器控制
  10. EXCEL 代码大全
  11. 010Editor分析
  12. 存储结构的定义及其分类
  13. 30天自制操作系统——自写设计
  14. 【POJ 3322】 Bloxorz I
  15. 七夕总结:2018新型婚恋交友 App 激增!18禁,年轻人有点敢玩
  16. 【MySQL】单表访问之索引合并
  17. html实现自动清理js、css文件的缓存
  18. win32crypt :安装pywin32并解决模块找不到问题
  19. 手机端扣扣浏览器图片居中_实现图片始终居中显示于浏览器窗口中心位置
  20. QT下载网址(国内)

热门文章

  1. 进程调度(一)——FIFO算法
  2. Java--使用@Autowired报错Could not autowire. No beans of ‘XX‘ type found.
  3. 中国气体插入市场趋势报告、技术动态创新及市场预测
  4. u盘/内存卡可用容量变小有未分配空间如何解决
  5. 集成webhook实现自动刷新
  6. 工业互联网标识Handle企业节点搭建及开发服务
  7. 本周最新文献速递20210822
  8. jdk1.8下载需要登陆oracle账号解决
  9. HomeBrew上发布自己的脚本
  10. 【PHP】编写php扩展