昨天在决策树的认识时,使用到了pandas库,之前对这个库认识不多,但是昨天使用的时候就感觉挺方便的,今天学习一下pandas的一些用法.我主要学习到的功能为:

  • 读取保存excel数据
  • 使用pandas来绘制简单图形
    我在平时使用中就感觉到了使用openpyxl读取excel数据以及绘制简单的scatter,plot图时略显麻烦,所以着重学习了这两个方面.

首先,导入

import pandas as pd
import matplotlib.pyplot as plt
import numpy as np

因为数据为中文,所以需要设置一些东西.panda其实也是以numpy和matplotlib为基础的

plt.rcParams['font.sans-serif'] = ['SimHei']  # 用来正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False  # 用来正常显示负号

一些要用到的数据,主要用来设置刻度的

rapx = (114.4936096 - 112.6832583)/50
rapy = (23.87839806 - 22.49308313)/50
minx = 112.6832583+rapx*2
maxx = 114.4936096+rapx*2
miny = 22.49308313
maxy = 23.87839806

通过pd.read_excel来读取.函数名简单明了!同样的也可以读csv等文件.然后将数据的前五行输出查看一下

data = pd.read_excel('./二次打包.xlsx')
print(data.head())

u1s1,直接在终端显示略丑,在jupyter显示就挺好看的


索引操作.有三种方式:

  1. 直接索引data[ ][ ]的形式,不过需要注意的是,使用这种方式是先列后行,而且不支持切片操作
  2. 使用iloc,使用这个以后就可以直接根据数字序号进行索引了,而且变回了先行后列的索引方式,支持切片
  3. 使用loc,使用这个可以直接用列名或者行名来索引,即字符串

dropna()可以将含空的数据全部删除.有时用openpyxl的maxrow读取数据读到None就挺烦的.

test_data = data.iloc[:, 1:3]
df = pd.DataFrame(test_data)
df = df.dropna()

绘图,很方便,直接对dataframe对象.plot()就好,里面一些参数的设置.其中x=1,y=0这个就很方便,就是设置dataframe的第几列做x,第几列做y.可以用数字索引,也可以用’列名’的方式索引,很舒服

df.plot(kind = 'scatter',x=1, y=0, xlim=[minx, maxx], ylim=[miny, maxy], grid=1, xticks=np.arange(minx, maxx, rapx), yticks=np.arange(miny, maxy, rapy),rot=-90)


不过,并不是一直都很舒服.比如说画散点图的时候,一定要输入,x和y.这时就很难受,因为我的x想用默认的1,2,3,4…但是pandas我找了一圈好像没找到解决办法,所以最后索性就直接用plt.scatter()了.在使用这个的时候,还碰到一个问题,不知道为啥,如果先画折线图再画散点图,散点图就不知道为啥没了…待研究…

data_old = pd.read_excel('./新新完整.xlsx')
print(data_old.index.values)
data_old.plot(y='修正预测')
plt.scatter(y = data_old['任务标价'],x = data_old.index.values,c='r')
plt.show()


最后,保存excel的操作.to_excel(文件名)就好,这里设置index=0的意思是,不要行名.下面两张图是index=0和1的对比,看一眼就懂了

data['任务标价'][0]=111
data.to_excel('test.xlsx',index=0)



总的来说,pandas用起来很舒服,理论上.因为现在对openpyxl也比较熟悉了,虽然麻烦是麻烦了点,但是熟练的原因,可能还是不太想进入不熟悉的领域,得逼自己多用用pandas,熟悉熟悉.

初识pandas 读取excel,绘图相关推荐

  1. Python使用pandas读取Excel文件多个WorkSheet的数据并绘制柱状图和热力图

    问题描述:在当前文件夹中有一个存放同一门课程两个班级同学成绩的Excel文件"学生成绩.xlsx",每个工作表中存放一个班级的成绩.编写程序,使用pandas读取其中的数据,然后绘 ...

  2. Python+Pandas读取Excel文件分析关系最好的两个演员

    董老师又双叒叕送书啦,6本<Python程序设计基础与应用(第2版)> 推荐图书: <Python程序设计(第3版)>,(ISBN:978-7-302-55083-9),董付国 ...

  3. Python+pandas读取Excel文件统计最受欢迎的前3位演员

    推荐教材:<Python程序设计基础与应用>(ISBN:9787111606178),董付国,机械工业出版社,2018.8出版,2021.3第11次印刷 图书详情: 配套资源: 用书教师可 ...

  4. Python使用pandas读取Excel文件数据和预处理小案例

    假设有Excel文件data.xlsx,其中内容为 现在需要将这个Excel文件中的数据读入pandas,并且在后续的处理中不关心ID列,还需要把sex列的female替换为1,把sex列的male替 ...

  5. pandas读取Excel判断指定列是否有空值

    一.简介 有时我们用pandas读取Excel去获取某列或者某几列的值,并对该列的值进行处理时,一般都会先判断该列是否有空值,若有空值对其进行处理后再让程序往下走,否则不做判断可能程序会报错,比如用正 ...

  6. python pandas读取excel时动态确定标题行所在行数

    python pandas读取excel时动态确定标题行所在行数,动态跳过标题前空白行 利用python对excel或者csv文件进行批量操作时,除了使用xlrd库或者xlwt库进行表格的操作读与写, ...

  7. pandas 读取excel文件

    pandas 读取excel文件 一 read_excel() 的基本用法 二 read_excel() 的常用的参数: 三 示例 1. IO:路径 2. sheet_name:指定工作表名 3. h ...

  8. pandas玩转excel-> (2)如何利用pandas读取excel数据文件

    pandas玩转excel-> (2)如何利用pandas读取excel数据文件 import pandas as pd #将excel文件读到内存中,形成dataframe,并命名为peopl ...

  9. python数据可视化开发(2):pandas读取Excel的数据格式处理(数据读取、指定列数据、DataFrame转json、数学运算、透视表运算输出)

    系列文章目录 python开发低代码数据可视化大屏:pandas.read_excel读取表格 python实现直接读取excle数据实现的百度地图标注 python数据可视化开发(1):Matplo ...

最新文章

  1. 蓝松短视频经验分享----抠图和动画设计
  2. IDEA-2020版本 Gradle项目控制台输出乱码
  3. 在android studio中如何创建一个类来继承另外一个类_在Android使用Transition API检测用户活动...
  4. 数据结构 多路查找树 ---------B树和B+树的简单介绍
  5. 不用再更换整机了,苹果官方可修复iPhone 12系列破裂后盖玻璃
  6. js中数组的操作方法
  7. jmeter 一个可能引起性能严重下降的断言设置
  8. excel有多行不同内容需要向下填充
  9. 2021-2027全球与中国教育ERP套件软件市场现状及未来发展趋势
  10. 硅谷华人AI精英大批回国成趋势,BAT在美设「挖人」据点,猎头暗中潜伏
  11. 学python多大年龄可以学车_考驾照要多大年龄?
  12. 双宽带双路由搭建同一网段局域网
  13. Verilog基础语法--运算符【常用的几种】
  14. STM32生态系统 第三期(一)STM32WB无线协议栈和用户应用升级的准备工作
  15. 基于OPCAutomation的OPC DA Client 工具
  16. uniapp h5页面打开app,没有下载则跳转下载
  17. 金蝶品牌新战略浮出水面丨IBM助力数字货币走向成熟 【软件网每日新闻播报│第10-16期】
  18. 基于java的简单学生宿舍管理系统
  19. 每日一练--IT冷知识C/C++--第八天
  20. 【Redis代理】- Twemproxy,不来了解一哈?

热门文章

  1. Winform实现类似Viso的简单的流程图
  2. homeassistant智能家居
  3. PTA 7-56 365次方
  4. android 电池
  5. 2021年危险化学品经营单位主要负责人考试题库及危险化学品经营单位主要负责人考试试卷
  6. Vue的Excel文件下载
  7. C语言实现猜数字游戏(通俗易懂)
  8. java电话号码_java 验证手机号码、电话号码(包括最新的电信、联通和移动号码)...
  9. 华为WLAN射频资源管理
  10. 欧拉路径(一笔画问题)