这个专栏用来记录我在学习和实践《Python数据分析与挖掘实战》一书时的一些知识点总结和代码实现。

文章目录

  • 背景和目标
  • 数据
    • 客户基本信息
    • 乘机信息
    • 积分信息
  • 脚本
    • data_explore.py
    • data_clean.py
    • zscore_data.py
    • KMeans_cluster.py
    • cluster_plot.py
  • 分析方法和过程
    • 方法
    • 流程
    • 模型解释
    • 模型应用
    • 拓展

背景和目标

通过客户分类,区分无价值客户、高价值客户,从而针对不同人群制定优化的个性化服务方案,采取不同的营销策略,将有限营销资源集中于高价值客户,实现企业利润的最大化目标。
准确的客户分类结果是企业优化营销资源的重要依据,客户分类越来越成为客户关系管理中急需解决的问题之一。

主要分为以下几个步骤:

1)借助航空公司客户数据,对客户进行分类
2)对不同的客户类别进行特征分析,比较不同类客户的客户价值
3)对不同价值的客户类别提供个性化服务,指定相应的营销策略

数据

客户基本信息

属性名称 属性说明
MEMBER_NO 会员卡号
FFP_DATE 入会时间
FIRST_FLIGHT_DATE 第一次飞行日期
GENDER 性别
FFP_TIER 会员卡级别
WORK_CITY 工作地城市
WORK_PROVINCE 工作地所在省份
WORK_COUNTRY 工作地所在国家
AGE 年龄

乘机信息

属性名称 属性说明
FLIGHT_COUNT 观测窗口内的飞行次数
LOAD_TIME 观测窗口的结束时间
LAST_TO_END 最后一次乘机时间至观测窗口结束时长
AVG_DISCOUNT 平均折扣率
SUM_YR 观测窗口的票价收入
SEG_KM_SUM 观测窗口的总飞行公里数
LAST_FLIGHT_DATE 末次飞行日期
AVG_INTERVAL 平均乘机时间间隔
MAX_INTERVAL 最大乘机时间间隔

积分信息

属性名称 属性说明
EXCHANGE_COUNT 积分兑换次数
EP_SUM 总精英积分
PROMOPTIVE_SUM 促销积分
PARTNER_SUM 合作伙伴积分
POINTS_SUM 总累计积分
POINT_NOTFLIGHT 非乘机的积分变动次数
BP_SUM 总基本积分

脚本

data_explore.py

#-*- coding: utf-8 -*-
# 对数据进行基本的探索
# 返回缺失值个数以及最大最小值import pandas as pddatafile = '../data/air_data.csv'  # 航空原始数据,第一行为属性标签
resultfile = '../tmp/explore.xls'  # 数据探索结果表# 读取原始数据,指定UTF-8编码(需要用文本编辑器将数据装换为UTF-8编码)
data = pd.read_csv(datafile, encoding='utf-8')# 包括对数据的基本描述,percentiles参数是指定计算多少的分位数表(如1/4分位数、中位数等);T是转置,转置后更方便查阅
explore = data.describe(percentiles=[], include='all').T
# print(explore)# describe()函数自动计算非空值数,需要手动计算空值数
explore['null'] = len(data) - explore['count']explore = explore[['null', 'max', 'min']]
explore.columns = [u'空值数', u'最大值', u'最小值']  #

(七)Python数据分析与挖掘实战(实战篇)——航空公司客户价值分析相关推荐

  1. python数据分析与挖掘项目实战记录

    python数据挖掘项目实战记录 取自<Python数据分析与挖掘实战>一书,整理各个项目中用到的数据处理方法: 数据预处理方法 建立模型方法 绘制图形 对于分类问题:用模型分类:混淆矩阵 ...

  2. 《Python数据分析与挖掘》实战项目 - Python程序设计(期末大作业、课程设计、毕业设计)2012-2021近十年考研英语一真题词汇词频统计与可视化(附代码)

    <Python数据分析与挖掘> - 2012-2021近十年考研英语一真题词汇词频统计与可视化 声明 本文仅在CSDN发布,其他均为盗版.请支持正版! 正版链接: https://blog ...

  3. Python数据挖掘:利用聚类算法进行航空公司客户价值分析

    无小意丶 个人博客地址:无小意 知乎主页:无小意丶 公众号: 数据路(shuju_lu) 刚刚开始写博客,希望能保持关注,会继续努力. 以数据相关为主,互联网为辅进行文章发布. 本文是<Pyth ...

  4. (八)Python数据分析与挖掘实战(实战篇)——中医证型关联规则挖掘

    这个专栏用来记录我在学习和实践<Python数据分析与挖掘实战>一书时的一些知识点总结和代码实现. 文章目录 背景和目标 数据 原始属性表 脚本 discretization.py apr ...

  5. python数据挖掘与分析实战pdf_《Python数据分析与挖掘实战》PDF+完整源码

    该楼层疑似违规已被系统折叠 隐藏此楼查看此楼 本书共15章,分两个部分:基础篇.实战篇.基础篇介绍了数据挖掘的基本原理,实战篇介绍了一个个真实案例,通过对案例深入浅出的剖析,使读者在不知不觉中通过案例 ...

  6. python数据分析与挖掘实战pdf_《Python数据分析与挖掘实战》PDF+完整源码

    该楼层疑似违规已被系统折叠 隐藏此楼查看此楼 本书共15章,分两个部分:基础篇.实战篇.基础篇介绍了数据挖掘的基本原理,实战篇介绍了一个个真实案例,通过对案例深入浅出的剖析,使读者在不知不觉中通过案例 ...

  7. 《Python数据分析与挖掘实战》第7章-聚类+绘制雷达图

    本文是基于<Python数据分析与挖掘实战>的第七章的数据--<航空公司客户价值分析>做的分析对部分代码,做出补充,对原文中的雷达图进行了实现. 1. 背景与目标分析 此项目旨 ...

  8. 大数据培训课程分享:Python数据分析与挖掘实战课程介绍

    <Python数据分析与挖掘实战>课程内容以Python数据分析与挖掘的常用技术与真实案例相结合的方式,深入浅出地介绍Python数据分析与挖掘的重要内容,共分为基础篇(第1~5章)和实战 ...

  9. 《Python数据分析与挖掘实战》第10章(下)——DNN2 筛选得“候选洗浴事件”3 构建模型

    本文是基于<Python数据分析与挖掘实战>的实战部分的第10章的数据--<家用电器用户行为分析与事件识别> 做的分析. 接着前一篇文章的内容,本篇博文重点是处理用水事件中的属 ...

最新文章

  1. oracle使用小技巧
  2. 2021-04-15 深入理解SLAM技术 【2】 SLAM的框架
  3. IDA执行python脚本文件,python编辑器的操作
  4. 计算机中的进制和编码
  5. win32 api 文件操作!
  6. 加油站会员管理系统源码php_加油站使用会员管理系统,如何解决行业瓶颈?
  7. mysql-5.6.31.tar.gz_MySQL5.6.31源码安装
  8. python-day19-面向对象进阶-加载顺序,命名空间,组合(实现松耦合)
  9. CSRF verification failed. Request aborted.
  10. python调用按键精灵插件_[良心教程]分享最新最实用的按键精灵封装函数
  11. 什么是数据抽取 --全量抽取、增量抽取
  12. 解压软件安装包,winrar
  13. 【M365运维】匹配用户UPN和Email地址
  14. 双屏计算机主机是什么,电脑双屏显示有人知道关于一个主机两个显示器的问题吗 爱问知识人...
  15. 【读论文】基于深度学习的铁路道岔转辙机故障诊断(3DESIGN)
  16. GOF23式——Prototype
  17. 单声道蓝牙实现音乐播放
  18. 产品故事:一家服装厂的创新之路
  19. 孙鑫老师MFC视频使用的MSDN帮助文档下载及安装
  20. yum安装Redis教程

热门文章

  1. n皇后问题的子集树求解与排列树求解
  2. AttributeError: ‘HTMLParser‘ object has no attribute ‘unescape‘解决方案
  3. matlab衍射,使用Matlab设计制造衍射光学元件DOEs
  4. 计算广告、推荐系统论文以及DSP综述
  5. 【机器翻译】调优和测评
  6. 产品过程之—产品规划篇
  7. 2020西邮linux兴趣小组纳新题题解
  8. miRNA靶基因软件预测分值如何看?
  9. MATLAB抽样定理实验
  10. 华为OD机试3个排序题