一. 简答题(共1题,100分)

  1. (简答题, 100分)
    文件bankpep.csv存放着银行储户的基本信息,数据格式如表4-7所示。

    通过绘图对这些客户数据进行可视化分析。
    (1)客户年龄分布的直方图和密度图(见图4-25)。
    (2)客户年龄和收入关系的散点图(见图4-26)。

    图4-25 客户年龄分布

    图4-26 按客户年龄和收入关系绘制的散点图

(3)绘制散点图观察客户(年龄、收入、孩子数)之间的关系,用对角线显示直方图(见图4-27)。
(4)按区域展示平均收入的柱状图,并显示标准差(见图4-28)。

图4-27 按客户年龄、收入、孩子数关系绘制的散点矩阵

图4-28 各区域客户的平均收入

(5)多子图绘制:客户中性别占比饼图,有车客户的性别占比饼图,按孩子数的客户占比饼图(见图4-29)。
(6)各性别、收入绘制的箱形图(见图4-30)。

图4-29 按性别、有车客户的性别、孩子数占比绘制的饼图

图4-30 按性别、收入绘制的箱形图
bankpep.csv

解题

import matplotlib.pyplot as plt
import pandas as pd
from pandas import DataFrame
import numpy as np
import matplotlibdata = pd.read_csv('C:\\python\\bankpep.csv')# 1)
plt.hist(data['age'],bins=10,density=True)
data['age'].plot(kind='kde')
plt.title('Customer Age')
plt.xlabel('Age')
plt.ylabel('Density')
plt.show()# 2)
plt.scatter(data['age'],data['income'],label = '(age,income)',marker=',',s=7)
plt.grid(True)
plt.xlim(0,80)
plt.title('Customer Income')
plt.legend()
plt.xlabel('Age')
plt.ylabel('Income')
plt.show()# 3)
pd.plotting.scatter_matrix(data[['age','income','children']])
plt.show()# 4)
mean = data.groupby(['region']).agg({'income':np.mean})
std = data.groupby(['region']).agg({'income':np.std})
plt.bar(mean.index,mean.income,yerr=std.income,width=0.6)
plt.xlabel('Recion')
plt.title('Customer Income')
plt.xticks(rotation=45)
plt.show()# 5)
fig=plt.figure(figsize=(6,6))ax1=fig.add_subplot(2,2,1)
list1=data.groupby(['sex'])['sex'].count()
plt.pie(list1,labels=['FEMALE','MALE'],startangle = 45,autopct='%0.1f%%')
plt.ylabel('sex')
plt.title('Customer Sex')ax2=fig.add_subplot(2,2,2)
list1=data[data['car'] =='YES'].groupby(['sex'])['sex'].count()
plt.pie(list1,labels=['FEMALE','MALE'],startangle = 45,autopct='%0.1f%%')
plt.ylabel('sex')
plt.title('Customer Car Sex')ax3=fig.add_subplot(223)
list1=data.groupby(['children'])['children'].count()
plt.pie(list1,labels=[0,1,2,3],startangle = 45,autopct='%0.1f%%')
plt.ylabel('Children')
plt.title('Customer Children')plt.show()# 6)
MALE = data[data['sex']=='MALE']['income']
FEMALE = data[data['sex']=='FEMALE']['income']
plt.boxplot([FEMALE,MALE],labels=['FEMALE','MALE'])
plt.xlabel('[sex]')
plt.title('Boxplot grouped by sex income')
plt.grid(True)
plt.show()

dhu 数据科学与技术 第7次作业相关推荐

  1. dhu 数据科学与技术 第2次作业

    一. 简答题(共2题,100分) (简答题, 50分) "大润发"."沃尔玛"."联华"和"农工商"四个超市都卖苹果.香 ...

  2. dhu 数据科学与技术 第1次作业

    ​ 一. 简答题(共2题,100分) (简答题, 50分)编写Python程序实现以下功能:从键盘输入若干同学的姓名,保存在字符串列表中:输入某个同学的名字,检索是否已保存在列表中. list=[] ...

  3. 作者:程学旗(1972-),男,中国科学院计算技术研究所研究员、博士生导师、副所长,中国科学院网络数据科学与技术重点实验室主任。...

    程学旗(1972-),男,中国科学院计算技术研究所研究员.博士生导师.副所长,中国科学院网络数据科学与技术重点实验室主任.中国计算机学会理事.大数据专家委员会秘书长,中国中文信息学会常务理事.信息检索 ...

  4. 作者:王海洋(1980-),男,中国科学院计算技术研究所网络数据科学与技术重点实验室、烟台中科网络技术研究所工程师。...

    王海洋(1980-),男,中国科学院计算技术研究所网络数据科学与技术重点实验室.烟台中科网络技术研究所工程师,主要研究方向为数据采集.存储.检索.大数据存储管理等.

  5. 作者:程学旗,男,中国科学院计算技术研究所研究员、博士生导师,中国科学院“网络数据科学与技术”重点实验室主任。...

    程学旗,男,中国科学院计算技术研究所研究员.博士生导师,中国科学院"网络数据科学与技术"重点实验室主任,目前主要从事网络数据科学和社会计算等研究领域的工作,主持和参与多项国家&qu ...

  6. 爬动漫网站数据_通过这三种动漫爱上数据科学和技术

    爬动漫网站数据 Yes, it might seem weird to mention anime, data science, and technology in the same breath. ...

  7. 2020 年中科院计算所“计算未来”全国大学生暑期班 网络数据科学与技术重点实验室 机试试题

    2020 年中科院计算所"计算未来"全国大学生暑期班网络数据科学与技术重点实验室 机试试题 前言 这是2021级计算所网数的推免机试,双机位.时间是两个半小时吧(不记得了) 我觉得 ...

  8. AI:人工智能领域主要方向(技术和应用)、与机器学习/深度学习的关系、数据科学关键技术与知识发现/数据挖掘/统计学/模式识别/神经计算学/数据库的关系(几张图理清之间的暧昧关系)

    AI:人工智能领域主要方向(技术和应用).与机器学习/深度学习的关系.数据科学关键技术与知识发现/数据挖掘/统计学/模式识别/神经计算学/数据库的关系(几张图理清之间的暧昧关系) 目录 人工智能主要领 ...

  9. python数据科学常国珍_python数据科学:技术详解与商业实践

    前言 章数据科学家的武器库 1.1数据科学的基本概念 1.2数理统计技术 1.2.1描述性统计分析 1.2.2统计推断与统计建模 1.3数据挖掘的技术与方法 1.4描述性数据挖掘算法示例 1.4.1聚 ...

最新文章

  1. React简单表单最佳实践
  2. 7.2.2 - 并发多线程 开启进程的两种方式
  3. 9.3 Trains and Evaluates the MNIST network using a feed dictionary
  4. C语言再学习 -- 详解C++/C 面试题 1
  5. 实例学习SSIS(一)--制作一个简单的ETL包
  6. 一个简单易用的图标字体库和CSS框架fontawesome
  7. linux 内存使用率_我的内存都去哪里了?| 美创运维日记
  8. 【算法】剑指 Offer 56 - II. 数组中数字出现的次数 II 【重刷】
  9. 95-190-438-源码-window-Trigger-总体概述
  10. Android Fatal signal 11 (SIGSEGV), code 1 (SEGV_MAPERR), fault addr 0x10 in tid 5287 (HeapTaskDaemo
  11. 如何重置HDX卡的固件(firmware)
  12. C#版TXT文本分割器
  13. matlab制作有值显示的条形统计图
  14. three.js 场景编辑器 源码解析(二)
  15. 谷歌Chrome浏览器无法安装插件的解决方法
  16. 【Python】turtle海龟画图练习
  17. python基于scrapy爬取京东笔记本电脑数据并进行简单处理和分析
  18. 3D引擎中的大量Morph 动画, 变形变形变形
  19. 50种快速提升网站流量方法
  20. python银行账户资金交易管理办法_银行账户资金托管业务管理实施细则模版

热门文章

  1. P2036PERKET
  2. 股价跌到“1美元“退市线之下,昔日巨头四季教育成沧海一粟?
  3. 型男索女俊男美女 说法大搜罗
  4. 不要让自己成为温水里的青蛙
  5. STMF4编写系统时钟
  6. 阿里云网络解决方案架构师任江波:全球一张网,支撑游戏业务高效互联
  7. 生物信息学个人电脑系统配置(Ubuntu 20.04)
  8. 前端导出zip格式压缩包
  9. 音频-ffmpeg音频格式转换
  10. PyTorch运行加载数据后占有大量C盘空间如何释放