(七)Python数据分析与挖掘实战(实战篇)——航空公司客户价值分析
这个专栏用来记录我在学习和实践《Python数据分析与挖掘实战》一书时的一些知识点总结和代码实现。
文章目录
- 背景和目标
- 数据
- 客户基本信息
- 乘机信息
- 积分信息
- 脚本
- data_explore.py
- data_clean.py
- zscore_data.py
- KMeans_cluster.py
- cluster_plot.py
- 分析方法和过程
- 方法
- 流程
- 模型解释
- 模型应用
- 拓展
背景和目标
通过客户分类,区分无价值客户、高价值客户,从而针对不同人群制定优化的个性化服务方案,采取不同的营销策略,将有限营销资源集中于高价值客户,实现企业利润的最大化目标。
准确的客户分类结果是企业优化营销资源的重要依据,客户分类越来越成为客户关系管理中急需解决的问题之一。
主要分为以下几个步骤:
1)借助航空公司客户数据,对客户进行分类
2)对不同的客户类别进行特征分析,比较不同类客户的客户价值
3)对不同价值的客户类别提供个性化服务,指定相应的营销策略
数据
客户基本信息
属性名称 | 属性说明 |
---|---|
MEMBER_NO | 会员卡号 |
FFP_DATE | 入会时间 |
FIRST_FLIGHT_DATE | 第一次飞行日期 |
GENDER | 性别 |
FFP_TIER | 会员卡级别 |
WORK_CITY | 工作地城市 |
WORK_PROVINCE | 工作地所在省份 |
WORK_COUNTRY | 工作地所在国家 |
AGE | 年龄 |
乘机信息
属性名称 | 属性说明 |
---|---|
FLIGHT_COUNT | 观测窗口内的飞行次数 |
LOAD_TIME | 观测窗口的结束时间 |
LAST_TO_END | 最后一次乘机时间至观测窗口结束时长 |
AVG_DISCOUNT | 平均折扣率 |
SUM_YR | 观测窗口的票价收入 |
SEG_KM_SUM | 观测窗口的总飞行公里数 |
LAST_FLIGHT_DATE | 末次飞行日期 |
AVG_INTERVAL | 平均乘机时间间隔 |
MAX_INTERVAL | 最大乘机时间间隔 |
积分信息
属性名称 | 属性说明 |
---|---|
EXCHANGE_COUNT | 积分兑换次数 |
EP_SUM | 总精英积分 |
PROMOPTIVE_SUM | 促销积分 |
PARTNER_SUM | 合作伙伴积分 |
POINTS_SUM | 总累计积分 |
POINT_NOTFLIGHT | 非乘机的积分变动次数 |
BP_SUM | 总基本积分 |
脚本
data_explore.py
#-*- coding: utf-8 -*-
# 对数据进行基本的探索
# 返回缺失值个数以及最大最小值import pandas as pddatafile = '../data/air_data.csv' # 航空原始数据,第一行为属性标签
resultfile = '../tmp/explore.xls' # 数据探索结果表# 读取原始数据,指定UTF-8编码(需要用文本编辑器将数据装换为UTF-8编码)
data = pd.read_csv(datafile, encoding='utf-8')# 包括对数据的基本描述,percentiles参数是指定计算多少的分位数表(如1/4分位数、中位数等);T是转置,转置后更方便查阅
explore = data.describe(percentiles=[], include='all').T
# print(explore)# describe()函数自动计算非空值数,需要手动计算空值数
explore['null'] = len(data) - explore['count']explore = explore[['null', 'max', 'min']]
explore.columns = [u'空值数', u'最大值', u'最小值'] #
(七)Python数据分析与挖掘实战(实战篇)——航空公司客户价值分析相关推荐
- python数据分析与挖掘项目实战记录
python数据挖掘项目实战记录 取自<Python数据分析与挖掘实战>一书,整理各个项目中用到的数据处理方法: 数据预处理方法 建立模型方法 绘制图形 对于分类问题:用模型分类:混淆矩阵 ...
- 《Python数据分析与挖掘》实战项目 - Python程序设计(期末大作业、课程设计、毕业设计)2012-2021近十年考研英语一真题词汇词频统计与可视化(附代码)
<Python数据分析与挖掘> - 2012-2021近十年考研英语一真题词汇词频统计与可视化 声明 本文仅在CSDN发布,其他均为盗版.请支持正版! 正版链接: https://blog ...
- Python数据挖掘:利用聚类算法进行航空公司客户价值分析
无小意丶 个人博客地址:无小意 知乎主页:无小意丶 公众号: 数据路(shuju_lu) 刚刚开始写博客,希望能保持关注,会继续努力. 以数据相关为主,互联网为辅进行文章发布. 本文是<Pyth ...
- (八)Python数据分析与挖掘实战(实战篇)——中医证型关联规则挖掘
这个专栏用来记录我在学习和实践<Python数据分析与挖掘实战>一书时的一些知识点总结和代码实现. 文章目录 背景和目标 数据 原始属性表 脚本 discretization.py apr ...
- python数据挖掘与分析实战pdf_《Python数据分析与挖掘实战》PDF+完整源码
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼 本书共15章,分两个部分:基础篇.实战篇.基础篇介绍了数据挖掘的基本原理,实战篇介绍了一个个真实案例,通过对案例深入浅出的剖析,使读者在不知不觉中通过案例 ...
- python数据分析与挖掘实战pdf_《Python数据分析与挖掘实战》PDF+完整源码
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼 本书共15章,分两个部分:基础篇.实战篇.基础篇介绍了数据挖掘的基本原理,实战篇介绍了一个个真实案例,通过对案例深入浅出的剖析,使读者在不知不觉中通过案例 ...
- 《Python数据分析与挖掘实战》第7章-聚类+绘制雷达图
本文是基于<Python数据分析与挖掘实战>的第七章的数据--<航空公司客户价值分析>做的分析对部分代码,做出补充,对原文中的雷达图进行了实现. 1. 背景与目标分析 此项目旨 ...
- 大数据培训课程分享:Python数据分析与挖掘实战课程介绍
<Python数据分析与挖掘实战>课程内容以Python数据分析与挖掘的常用技术与真实案例相结合的方式,深入浅出地介绍Python数据分析与挖掘的重要内容,共分为基础篇(第1~5章)和实战 ...
- 《Python数据分析与挖掘实战》第10章(下)——DNN2 筛选得“候选洗浴事件”3 构建模型
本文是基于<Python数据分析与挖掘实战>的实战部分的第10章的数据--<家用电器用户行为分析与事件识别> 做的分析. 接着前一篇文章的内容,本篇博文重点是处理用水事件中的属 ...
最新文章
- oracle使用小技巧
- 2021-04-15 深入理解SLAM技术 【2】 SLAM的框架
- IDA执行python脚本文件,python编辑器的操作
- 计算机中的进制和编码
- win32 api 文件操作!
- 加油站会员管理系统源码php_加油站使用会员管理系统,如何解决行业瓶颈?
- mysql-5.6.31.tar.gz_MySQL5.6.31源码安装
- python-day19-面向对象进阶-加载顺序,命名空间,组合(实现松耦合)
- CSRF verification failed. Request aborted.
- python调用按键精灵插件_[良心教程]分享最新最实用的按键精灵封装函数
- 什么是数据抽取 --全量抽取、增量抽取
- 解压软件安装包,winrar
- 【M365运维】匹配用户UPN和Email地址
- 双屏计算机主机是什么,电脑双屏显示有人知道关于一个主机两个显示器的问题吗 爱问知识人...
- 【读论文】基于深度学习的铁路道岔转辙机故障诊断(3DESIGN)
- GOF23式——Prototype
- 单声道蓝牙实现音乐播放
- 产品故事:一家服装厂的创新之路
- 孙鑫老师MFC视频使用的MSDN帮助文档下载及安装
- yum安装Redis教程