dhu 数据科学与技术 第7次作业
一. 简答题(共1题,100分)
- (简答题, 100分)
文件bankpep.csv存放着银行储户的基本信息,数据格式如表4-7所示。
通过绘图对这些客户数据进行可视化分析。
(1)客户年龄分布的直方图和密度图(见图4-25)。
(2)客户年龄和收入关系的散点图(见图4-26)。
图4-25 客户年龄分布
图4-26 按客户年龄和收入关系绘制的散点图
(3)绘制散点图观察客户(年龄、收入、孩子数)之间的关系,用对角线显示直方图(见图4-27)。
(4)按区域展示平均收入的柱状图,并显示标准差(见图4-28)。
图4-27 按客户年龄、收入、孩子数关系绘制的散点矩阵
图4-28 各区域客户的平均收入
(5)多子图绘制:客户中性别占比饼图,有车客户的性别占比饼图,按孩子数的客户占比饼图(见图4-29)。
(6)各性别、收入绘制的箱形图(见图4-30)。
图4-29 按性别、有车客户的性别、孩子数占比绘制的饼图
图4-30 按性别、收入绘制的箱形图
bankpep.csv
解题
import matplotlib.pyplot as plt
import pandas as pd
from pandas import DataFrame
import numpy as np
import matplotlibdata = pd.read_csv('C:\\python\\bankpep.csv')# 1)
plt.hist(data['age'],bins=10,density=True)
data['age'].plot(kind='kde')
plt.title('Customer Age')
plt.xlabel('Age')
plt.ylabel('Density')
plt.show()# 2)
plt.scatter(data['age'],data['income'],label = '(age,income)',marker=',',s=7)
plt.grid(True)
plt.xlim(0,80)
plt.title('Customer Income')
plt.legend()
plt.xlabel('Age')
plt.ylabel('Income')
plt.show()# 3)
pd.plotting.scatter_matrix(data[['age','income','children']])
plt.show()# 4)
mean = data.groupby(['region']).agg({'income':np.mean})
std = data.groupby(['region']).agg({'income':np.std})
plt.bar(mean.index,mean.income,yerr=std.income,width=0.6)
plt.xlabel('Recion')
plt.title('Customer Income')
plt.xticks(rotation=45)
plt.show()# 5)
fig=plt.figure(figsize=(6,6))ax1=fig.add_subplot(2,2,1)
list1=data.groupby(['sex'])['sex'].count()
plt.pie(list1,labels=['FEMALE','MALE'],startangle = 45,autopct='%0.1f%%')
plt.ylabel('sex')
plt.title('Customer Sex')ax2=fig.add_subplot(2,2,2)
list1=data[data['car'] =='YES'].groupby(['sex'])['sex'].count()
plt.pie(list1,labels=['FEMALE','MALE'],startangle = 45,autopct='%0.1f%%')
plt.ylabel('sex')
plt.title('Customer Car Sex')ax3=fig.add_subplot(223)
list1=data.groupby(['children'])['children'].count()
plt.pie(list1,labels=[0,1,2,3],startangle = 45,autopct='%0.1f%%')
plt.ylabel('Children')
plt.title('Customer Children')plt.show()# 6)
MALE = data[data['sex']=='MALE']['income']
FEMALE = data[data['sex']=='FEMALE']['income']
plt.boxplot([FEMALE,MALE],labels=['FEMALE','MALE'])
plt.xlabel('[sex]')
plt.title('Boxplot grouped by sex income')
plt.grid(True)
plt.show()
dhu 数据科学与技术 第7次作业相关推荐
- dhu 数据科学与技术 第2次作业
一. 简答题(共2题,100分) (简答题, 50分) "大润发"."沃尔玛"."联华"和"农工商"四个超市都卖苹果.香 ...
- dhu 数据科学与技术 第1次作业
一. 简答题(共2题,100分) (简答题, 50分)编写Python程序实现以下功能:从键盘输入若干同学的姓名,保存在字符串列表中:输入某个同学的名字,检索是否已保存在列表中. list=[] ...
- 作者:程学旗(1972-),男,中国科学院计算技术研究所研究员、博士生导师、副所长,中国科学院网络数据科学与技术重点实验室主任。...
程学旗(1972-),男,中国科学院计算技术研究所研究员.博士生导师.副所长,中国科学院网络数据科学与技术重点实验室主任.中国计算机学会理事.大数据专家委员会秘书长,中国中文信息学会常务理事.信息检索 ...
- 作者:王海洋(1980-),男,中国科学院计算技术研究所网络数据科学与技术重点实验室、烟台中科网络技术研究所工程师。...
王海洋(1980-),男,中国科学院计算技术研究所网络数据科学与技术重点实验室.烟台中科网络技术研究所工程师,主要研究方向为数据采集.存储.检索.大数据存储管理等.
- 作者:程学旗,男,中国科学院计算技术研究所研究员、博士生导师,中国科学院“网络数据科学与技术”重点实验室主任。...
程学旗,男,中国科学院计算技术研究所研究员.博士生导师,中国科学院"网络数据科学与技术"重点实验室主任,目前主要从事网络数据科学和社会计算等研究领域的工作,主持和参与多项国家&qu ...
- 爬动漫网站数据_通过这三种动漫爱上数据科学和技术
爬动漫网站数据 Yes, it might seem weird to mention anime, data science, and technology in the same breath. ...
- 2020 年中科院计算所“计算未来”全国大学生暑期班 网络数据科学与技术重点实验室 机试试题
2020 年中科院计算所"计算未来"全国大学生暑期班网络数据科学与技术重点实验室 机试试题 前言 这是2021级计算所网数的推免机试,双机位.时间是两个半小时吧(不记得了) 我觉得 ...
- AI:人工智能领域主要方向(技术和应用)、与机器学习/深度学习的关系、数据科学关键技术与知识发现/数据挖掘/统计学/模式识别/神经计算学/数据库的关系(几张图理清之间的暧昧关系)
AI:人工智能领域主要方向(技术和应用).与机器学习/深度学习的关系.数据科学关键技术与知识发现/数据挖掘/统计学/模式识别/神经计算学/数据库的关系(几张图理清之间的暧昧关系) 目录 人工智能主要领 ...
- python数据科学常国珍_python数据科学:技术详解与商业实践
前言 章数据科学家的武器库 1.1数据科学的基本概念 1.2数理统计技术 1.2.1描述性统计分析 1.2.2统计推断与统计建模 1.3数据挖掘的技术与方法 1.4描述性数据挖掘算法示例 1.4.1聚 ...
最新文章
- React简单表单最佳实践
- 7.2.2 - 并发多线程 开启进程的两种方式
- 9.3 Trains and Evaluates the MNIST network using a feed dictionary
- C语言再学习 -- 详解C++/C 面试题 1
- 实例学习SSIS(一)--制作一个简单的ETL包
- 一个简单易用的图标字体库和CSS框架fontawesome
- linux 内存使用率_我的内存都去哪里了?| 美创运维日记
- 【算法】剑指 Offer 56 - II. 数组中数字出现的次数 II 【重刷】
- 95-190-438-源码-window-Trigger-总体概述
- Android Fatal signal 11 (SIGSEGV), code 1 (SEGV_MAPERR), fault addr 0x10 in tid 5287 (HeapTaskDaemo
- 如何重置HDX卡的固件(firmware)
- C#版TXT文本分割器
- matlab制作有值显示的条形统计图
- three.js 场景编辑器 源码解析(二)
- 谷歌Chrome浏览器无法安装插件的解决方法
- 【Python】turtle海龟画图练习
- python基于scrapy爬取京东笔记本电脑数据并进行简单处理和分析
- 3D引擎中的大量Morph 动画, 变形变形变形
- 50种快速提升网站流量方法
- python银行账户资金交易管理办法_银行账户资金托管业务管理实施细则模版