初识pandas 读取excel,绘图
昨天在决策树的认识时,使用到了pandas库,之前对这个库认识不多,但是昨天使用的时候就感觉挺方便的,今天学习一下pandas的一些用法.我主要学习到的功能为:
- 读取保存excel数据
- 使用pandas来绘制简单图形
我在平时使用中就感觉到了使用openpyxl读取excel数据以及绘制简单的scatter,plot图时略显麻烦,所以着重学习了这两个方面.
首先,导入
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
因为数据为中文,所以需要设置一些东西.panda其实也是以numpy和matplotlib为基础的
plt.rcParams['font.sans-serif'] = ['SimHei'] # 用来正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False # 用来正常显示负号
一些要用到的数据,主要用来设置刻度的
rapx = (114.4936096 - 112.6832583)/50
rapy = (23.87839806 - 22.49308313)/50
minx = 112.6832583+rapx*2
maxx = 114.4936096+rapx*2
miny = 22.49308313
maxy = 23.87839806
通过pd.read_excel来读取.函数名简单明了!同样的也可以读csv等文件.然后将数据的前五行输出查看一下
data = pd.read_excel('./二次打包.xlsx')
print(data.head())
u1s1,直接在终端显示略丑,在jupyter显示就挺好看的
索引操作.有三种方式:
- 直接索引data[ ][ ]的形式,不过需要注意的是,使用这种方式是先列后行,而且不支持切片操作
- 使用iloc,使用这个以后就可以直接根据数字序号进行索引了,而且变回了先行后列的索引方式,支持切片
- 使用loc,使用这个可以直接用列名或者行名来索引,即字符串
dropna()可以将含空的数据全部删除.有时用openpyxl的maxrow读取数据读到None就挺烦的.
test_data = data.iloc[:, 1:3]
df = pd.DataFrame(test_data)
df = df.dropna()
绘图,很方便,直接对dataframe对象.plot()就好,里面一些参数的设置.其中x=1,y=0这个就很方便,就是设置dataframe的第几列做x,第几列做y.可以用数字索引,也可以用’列名’的方式索引,很舒服
df.plot(kind = 'scatter',x=1, y=0, xlim=[minx, maxx], ylim=[miny, maxy], grid=1, xticks=np.arange(minx, maxx, rapx), yticks=np.arange(miny, maxy, rapy),rot=-90)
不过,并不是一直都很舒服.比如说画散点图的时候,一定要输入,x和y.这时就很难受,因为我的x想用默认的1,2,3,4…但是pandas我找了一圈好像没找到解决办法,所以最后索性就直接用plt.scatter()了.在使用这个的时候,还碰到一个问题,不知道为啥,如果先画折线图再画散点图,散点图就不知道为啥没了…待研究…
data_old = pd.read_excel('./新新完整.xlsx')
print(data_old.index.values)
data_old.plot(y='修正预测')
plt.scatter(y = data_old['任务标价'],x = data_old.index.values,c='r')
plt.show()
最后,保存excel的操作.to_excel(文件名)就好,这里设置index=0的意思是,不要行名.下面两张图是index=0和1的对比,看一眼就懂了
data['任务标价'][0]=111
data.to_excel('test.xlsx',index=0)
总的来说,pandas用起来很舒服,理论上.因为现在对openpyxl也比较熟悉了,虽然麻烦是麻烦了点,但是熟练的原因,可能还是不太想进入不熟悉的领域,得逼自己多用用pandas,熟悉熟悉.
初识pandas 读取excel,绘图相关推荐
- Python使用pandas读取Excel文件多个WorkSheet的数据并绘制柱状图和热力图
问题描述:在当前文件夹中有一个存放同一门课程两个班级同学成绩的Excel文件"学生成绩.xlsx",每个工作表中存放一个班级的成绩.编写程序,使用pandas读取其中的数据,然后绘 ...
- Python+Pandas读取Excel文件分析关系最好的两个演员
董老师又双叒叕送书啦,6本<Python程序设计基础与应用(第2版)> 推荐图书: <Python程序设计(第3版)>,(ISBN:978-7-302-55083-9),董付国 ...
- Python+pandas读取Excel文件统计最受欢迎的前3位演员
推荐教材:<Python程序设计基础与应用>(ISBN:9787111606178),董付国,机械工业出版社,2018.8出版,2021.3第11次印刷 图书详情: 配套资源: 用书教师可 ...
- Python使用pandas读取Excel文件数据和预处理小案例
假设有Excel文件data.xlsx,其中内容为 现在需要将这个Excel文件中的数据读入pandas,并且在后续的处理中不关心ID列,还需要把sex列的female替换为1,把sex列的male替 ...
- pandas读取Excel判断指定列是否有空值
一.简介 有时我们用pandas读取Excel去获取某列或者某几列的值,并对该列的值进行处理时,一般都会先判断该列是否有空值,若有空值对其进行处理后再让程序往下走,否则不做判断可能程序会报错,比如用正 ...
- python pandas读取excel时动态确定标题行所在行数
python pandas读取excel时动态确定标题行所在行数,动态跳过标题前空白行 利用python对excel或者csv文件进行批量操作时,除了使用xlrd库或者xlwt库进行表格的操作读与写, ...
- pandas 读取excel文件
pandas 读取excel文件 一 read_excel() 的基本用法 二 read_excel() 的常用的参数: 三 示例 1. IO:路径 2. sheet_name:指定工作表名 3. h ...
- pandas玩转excel-> (2)如何利用pandas读取excel数据文件
pandas玩转excel-> (2)如何利用pandas读取excel数据文件 import pandas as pd #将excel文件读到内存中,形成dataframe,并命名为peopl ...
- python数据可视化开发(2):pandas读取Excel的数据格式处理(数据读取、指定列数据、DataFrame转json、数学运算、透视表运算输出)
系列文章目录 python开发低代码数据可视化大屏:pandas.read_excel读取表格 python实现直接读取excle数据实现的百度地图标注 python数据可视化开发(1):Matplo ...
最新文章
- 蓝松短视频经验分享----抠图和动画设计
- IDEA-2020版本 Gradle项目控制台输出乱码
- 在android studio中如何创建一个类来继承另外一个类_在Android使用Transition API检测用户活动...
- 数据结构 多路查找树 ---------B树和B+树的简单介绍
- 不用再更换整机了,苹果官方可修复iPhone 12系列破裂后盖玻璃
- js中数组的操作方法
- jmeter 一个可能引起性能严重下降的断言设置
- excel有多行不同内容需要向下填充
- 2021-2027全球与中国教育ERP套件软件市场现状及未来发展趋势
- 硅谷华人AI精英大批回国成趋势,BAT在美设「挖人」据点,猎头暗中潜伏
- 学python多大年龄可以学车_考驾照要多大年龄?
- 双宽带双路由搭建同一网段局域网
- Verilog基础语法--运算符【常用的几种】
- STM32生态系统 第三期(一)STM32WB无线协议栈和用户应用升级的准备工作
- 基于OPCAutomation的OPC DA Client 工具
- uniapp h5页面打开app,没有下载则跳转下载
- 金蝶品牌新战略浮出水面丨IBM助力数字货币走向成熟 【软件网每日新闻播报│第10-16期】
- 基于java的简单学生宿舍管理系统
- 每日一练--IT冷知识C/C++--第八天
- 【Redis代理】- Twemproxy,不来了解一哈?