python数据可视化编程_Python数据可视化编程实战-1
第1章
有两种方式更改运行参数:使用参数字典(rcparams)或调用matplotlib.rc()命令。第一种方式中,可以通过 rcparams字典访问并修改所有已经加载的配置项;第二种方式中,可以通过matplotlib.rc()传入属性的关键字元组来修改配置项。
使用 matplotlib. rcparams的例子。
import matplotlib as mpl
mpl. rcparams [ ‘lines.linewidth‘] = 2
mpl. rcparams [‘lines color‘] = ‘r‘
使用 matplotlib.rc()函数调用的例子。
import matplotlib as mpl
mpl. rc(‘lines‘, linewidth = 2, color= ‘r‘)
示例:
importmatplotlib. pyplot as pltimportnumpy as np
t= np. arange(0.0,1.0,0.01)
s=np.sin(2 *np.pi *t)#设置线为红色
plt.rcParams [‘lines.color‘] = ‘r‘plt.plot(t, s)
c=np.sin(2 *np.pi *t)#设置线的宽度(3有无引号均可)
plt. rcParams[‘lines.linewidth‘] = ‘3‘plt.plot(t,c)
plt.show()
1.9为项目设置参数
配置文件包括以下配置项:
◆ axes:设置坐标轴边界和表面的颜色、坐标刻度值大小和网格的显示。
◆ backend:设置目标输出 TkAgg和 GTKAgg。
◆ figure:控制dpi、边界颜色、图形大小和子区(subplot)设置。
◆ font:字体集( font family)、字体大小和样式设置。
◆ grid:设置网格颜色和线型。
◆ legend:设置图例和其中文本的显示。
◆ line:设置线条(颜色、线型、宽度等)和标记。
◆ patch: 是填充2D空间的图形对象,如多边形和圆。控制线宽、颜色和抗锯齿设置等。
◆ savefig:可以对保存的图形进行单独设置。例如,设置渲染的文件的背景为白色。
◆ text:设置字体颜色、文本解析(纯文本或 latex标记)等。
◆ verbose:设置 matplotlib在执行期间信息输出,如 silent、 helpful、 debug和debug- annoying。
◆ xticks和 yticks:为x、y轴的主刻度和次刻度设置颜色、大小、方向,以及标签大小。
第2章 了解数据
2.2 csv文件
importcsvfilename= "E:\\python_data_plot\\ch02\\ch02_data.csv"data=[]#打开文件
with open(filename) as f:
reader=csv.reader(f)
header= next(reader) #读取文件头
for row inreader:
temp= int(row[1]) #读取第二列的数据,原格式为字符串型,化为整型
data.append(row[1]) #存入数组
print(data)
2.3 读取excel文件
xlrd模块使用的对象模型:每一个工作簿workbook中包含多个工作表sheet,每个工作表中有多个单元格对象cell,我们从单元格中将值提取出来。
主要方法:
sheet.row_values(1) #读取第2行的值
sheet.cell(1, 1).value #读取特定单元格(第2行第2列)的值
importxlrd#读取excel文件一列数据
defexcel():#1.打开Excel文件
wb = xlrd.open_workbook(‘E:\\python_data_plot\\ch02\\MK.xlsx‘)#2.通过excel表格名称(rank)获取工作表
sheet = wb.sheet_by_name(‘Sheet1‘)
dat= [] #创建空list
#根据行数(nrows)和列数(ncols)读取单元格的内容
for a in range(1, sheet.nrows): #从第二行开始,循环读取表格内容(每次读取一行数据)
cells = sheet.row_values(a) #每行数据赋值给单元格cells
data = int(cells[0]) #因为表内可能存在多列数据,0代表第一列数据,1代表第二列,以此类推
dat.append(data) #把每次循环读取的数据插入到list
returndat
a= excel() #返回整个函数的值
print(a)
2.10 读取大块文件数据
对于数据特别大的数据,如包含几千万行数据的,处理起来很困难。这类文件不能一次性把文件数据读取进内存中,而是分很多次。
这一类读取文件的函数有两个参数:chunksize,iterator
1)指定CHUNKSIZE分块读取文件
read_csv 和 read_table 有一个chunksize参数,用以指定一个块大小(每次读取多少行),返回一个可迭代的 TextFileReader 对象。
table=pd.read_table(path+‘kuaishou.txt‘,sep=‘\t‘,chunksize=1000000)
2)指定迭代=真
reader = pd.read_table(‘tmp.sv‘, sep=‘\t‘, iterator=True)
2020-06-28 18:11:12
2.13 生成可控的随机数据集合
标准差:表示个体和群体之间的差异。如果差异越大,标准差会越大;如果所有个体实验在整组范围内基本相同,标准差会比较小。
方差:标准差的平方。
总体
样本:总体的子集。
主要用python的random模块生成数据,其主要用法如下:
importrandomprint(random.randint(1, 10)) #产生 1 到 10 的一个整数型随机数
print(random.random()) #产生 0 到 1 之间的随机浮点数
print(random.uniform(1.1, 5.4)) #产生 1.1 到 5.4 之间的随机浮点数,区间可以不是整数
print(random.choice(‘tomorrow‘)) #从序列中随机选取一个元素
print(random.randrange(1, 100, 2)) #生成从1到100的步长为2的随机整数(如得到33,33-1=32,为2的倍数)
print(random.sample(‘zyxwvutsrqponmlkjihgfedcba‘, 5)) #多个字符中生成指定数量的随机字符
a = [1,3,5,6,7] #将序列a中的元素顺序打乱
random.shuffle(a)print(a)
print(random.normalvariate(0.2, 1.2)) #从中值为0.2,标准差为1.2的正态分布中选取一个随机值
创建一个均匀分布的样本:
(pylab库结合了pyplot和numpy,对交互式使用来说比较方便,既可以画图又可以进行简单的计算。)
importpylabimportrandom
random.seed()
real_vars=[]
real_vars= [random.randint(0, 16) for val in range(100)] #生成100个在0-16之间的随机整数
print(real_vars)# 创建分为10段的柱状直方图
pylab.hist(real_vars, 10)#定义x轴和y轴的坐标轴标题
pylab.xlabel("number range")
pylab.ylabel("count")#显示图形
pylab.show()
第3章 绘制并定制化图表
3.2 定义图表类型----柱状图、线型图和堆积柱状图
from matplotlib.pyplot import *
#数据
x = [1, 2, 3, 4, 5, 6]
y= [3, 4, 6, 7, 3, 2]#创建新图形
figure()#把分区划分为2*3的网格,选择#1的位置
subplot(2, 3, 1)
plot(x, y)#柱状图,选择#2的位置
subplot(2, 3, 2)
bar(x, y)#水平(horizontal)柱状图,选择#3的位置
subplot(2, 3, 3)
barh(x, y)#叠加柱状图
subplot(2, 3, 4)
bar(x, y)#叠加柱状图所需要的补充数据
y1 = [2, 3, 4, 5, 6, 7]
bar(x, y1, bottom=y, color=‘r‘)#箱线图
subplot(2, 3, 5)
boxplot(x)#散点图
subplot(2, 3, 6)
scatter(x, y)
show()
补充说明:
figure():创建一个新的图表,给该方法传递字符串参数,这个字符串就会成为窗口的标题。
subplot(2, 3, 1):第一个参数是行数,第二个参数为列数,第三个参数表示图形的标号。
箱线图:一种用作显示一组数据分散情况资料的统计图。
3.3 简单的正弦图和余弦图
绘制的基本图表包含以下元素:
xlim()和ylim():坐标轴的最大和最小刻度。
xticks()和yticks():设置坐标轴的刻度间隔。
from matplotlib.pyplot import *
importnumpy as np#取-pi到pi之间具有相同线性距离的256个点
x = np.linspace(-np.pi, np.pi, 256, endpoint=True)
y= np.cos(x) #计算正弦值和余弦值
y1 =np.sin(x)
plot(x, y)#画正弦图和余弦图
plot(x, y1)
title("Function sin and cos") #定义题目
xlim(-3.0, 3.0) #设置x和y的范围
ylim(-1.0, 1.0)#设置坐标轴的刻度间隔
xticks([-np.pi, -np.pi/2, 0, np.pi/2, np.pi])
yticks([-1, 0, +1])
show()
#xlim(-3.0, 3.0) # 设置x和y的范围#ylim(-1.0, 1.0)
python数据可视化编程_Python数据可视化编程实战-1相关推荐
- python数据查询教程_Python数据可视化教程之基础篇
经过学习之后,我总结了利用python实现可视化的三个步骤: 确定问题,选择图形 转换数据,应用函数 参数设置,一目了然 1 首先,要知道我们用哪些库来画图? matplotlib python中最基 ...
- python用表格中的数据画柱状图_Python数据可视化:5种绘制柱状图表的方法(附源码)...
本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理 以下文章来源于数据Magic,作者我不是小样 前言 python里面有很多优秀的可 ...
- python前端框架实例_Python数据可视化:PyQt5 + ECharts框架实例
引言 对于Python下桌面软件的开发已经有了很多数据可视化的库,如Matplotlib.Seaborn.Pyqtgraph.Plotly等等,但这些库更适合于后端程序员的软件开发. 实际上在前端网页 ...
- python 财务分析可视化方法_Python数据可视化的四种简易方法
Python数据可视化的四种简易方法 作者:PHPYuan 时间:2018-11-28 03:40:43 摘要: 本文讲述了热图.二维密度图.蜘蛛图.树形图这四种Python数据可视化方法. 数据可视 ...
- python数据分析图表展示_NBA数据分析_python数据爬取_可视化图形_python数据可视化案例-帆软...
之前手痒做了一次NBA可视化分析,发个微头条,好多人追着我问教程,这两天终于闲下来了,花时间整理这篇NBA可视化分析教程,手把手教大家做一次炫酷的数据可视化分析! 先部分展示本次教程的作品: 数据获取 ...
- python图形绘制星空图_Python数据可视化教程:基于Plotly的动态可视化绘图
1. plotly 介绍 Plotly是一个非常著名且强大的开源数据可视化框架,它通过构建基于浏览器显示的web形式的可交互图表来展示信息,可创建多达数十种精美的图表和地图, 下面我们以jupyter ...
- python画厢式图_Python数据可视化:箱线图多种库画法
概念 箱线图通过数据的四分位数来展示数据的分布情况.例如:数据的中心位置,数据间的离散程度,是否有异常值等. 把数据从小到大进行排列并等分成四份,第一分位数(Q1),第二分位数(Q2)和第三分位数(Q ...
- python数据可视化图表_python数据可视化之pandas基础图表(一)
pandas可以做的不仅仅是加载和转换数据,它还可以可视化数据.比起一大堆的matplotlib代码,使用pandas内置的plot 函数绘图更简洁. 下面通过简单的例子掌握pandas基本的绘图方法 ...
- python数据科学库_Python数据科学库
python数据科学库 什么是数据科学? (What is Data Science?) We live in an information age, where the challenge is t ...
- python 图形化socket编程_Python黑帽编程2.8 套接字编程
Python黑帽编程2.8 套接字编程 套接字编程在本系列教程中地位并不是很突出,但是我们观察网络应用,绝大多数都是基于Socket来做的,哪怕是绝大多数的木马程序也是如此.官方关于socket编程的 ...
最新文章
- [THUWC2017]随机二分图
- c++把数组所有元素剔除_C语言基础之数组,第一节,C语言必学知识点剖析
- python日期函数引用_Python pandas.to_datetime函数方法的使用
- 4、C语言面试笔试--内存操作-指针
- java中断线程_Java中断线程的方法
- XDP(eXpress Data Path)防御DDoS攻击
- 《Head First设计模式》批注系列(一)——观察者设计模式
- 首席技术执行官_如何在几分钟内找到任何首席执行官的电子邮件地址
- 中科大少年班目前为止出过多少大牛?
- root - 计算机术语,root什么意思
- Win7旗舰版系统如何设置定时关机
- 第一个鸿蒙程序“hello world“
- nginx location 斜杠_【一点资讯】斜杠青年双·11买什么本最划算?光影精灵6让你做“多面娇娃” www.yidianzixun.com...
- C++ STL list输出和增加
- Node.js Web开发框架
- Android 系统构架
- 〖Python〗-- 函数闭包的理解
- 乒乓球单循环赛_乒乓球循环赛制比赛规则
- Linux Wps 缺少字体
- go实现文档中保存的微信图片.dat格式解密为图片