测试数据 fandango_score_comparison.csv


series

import pandas as pd
from pandas import Seriesfandango = pd.read_csv('fandango_score_comparison.csv')
series_film = fandango['FILM']
print(series_film[0:5])
print("----------------------------------")
series_rt = fandango['RottenTomatoes']
print(series_rt[0:5])
print("----------------------------------")
film_names = series_film.values
rt_scores = series_rt.values
# 带轴标的一维ndarray(包括时间序列)。
series_custom = Series(rt_scores, index=film_names)
print(series_custom[['Minions (2015)', 'Leviathan (2014)']])
print("----------------------------------")
print(series_custom[4:6])


sort

import pandas as pd
from pandas import Seriesfandango = pd.read_csv('fandango_score_comparison.csv')
series_film = fandango['FILM']
series_rt = fandango['RottenTomatoes']
film_names = series_film.values
rt_scores = series_rt.values
# 带轴标的一维ndarray(包括时间序列)。
series_custom = Series(rt_scores, index=film_names)
original_index = series_custom.index.tolist()
# sorted 以升序返回一个包含迭代中所有项的新列表。
sorted_index = sorted(original_index)
print(sorted_index)
print("----------------------------------")
# 按照已排序后的sorted_index来排序series_custom (sorted_index 和 series_custom.index 元素需保持一致)
sorted_by_index = series_custom.reindex(sorted_index)
print(sorted_by_index)

import pandas as pd
from pandas import Seriesfandango = pd.read_csv('fandango_score_comparison.csv')
series_film = fandango['FILM']
series_rt = fandango['RottenTomatoes']
film_names = series_film.values
rt_scores = series_rt.values
# 带轴标的一维ndarray(包括时间序列)。
series_custom = Series(rt_scores, index=film_names)
sc2 = series_custom.sort_index()
print(sc2[0:4])
print("----------------------------------")
sc3 = series_custom.sort_values()
print(sc3[0:4])


series算术运算

import pandas as pd
from pandas import Series
import numpy as npfandango = pd.read_csv('fandango_score_comparison.csv')
series_film = fandango['FILM']
series_rt = fandango['RottenTomatoes']
film_names = series_film.values
rt_scores = series_rt.values
# 带轴标的一维ndarray(包括时间序列)。
series_custom = Series(rt_scores, index=film_names)
print(series_custom[0:3])
print("----------------------------------")
# 将每个值相加
print(np.add(series_custom, series_custom)[0:3])
print("----------------------------------")
# 对每个值应用正弦函数
print(np.sin(series_custom)[0:3])
print("----------------------------------")
# 返回最高值(将返回单个值而不是一系列值)
print(np.max(series_custom))

import pandas as pd
from pandas import Seriesfandango = pd.read_csv('fandango_score_comparison.csv')
series_film = fandango['FILM']
series_rt = fandango['RottenTomatoes']
film_names = series_film.values
rt_scores = series_rt.values
# 带轴标的一维ndarray(包括时间序列)。
series_custom = Series(rt_scores, index=film_names)
# series_custom > 50 会为每个film返回一个带有布尔值的系列对象
series_greater_than_50 = series_custom[series_custom > 50]
print(series_greater_than_50[0:5])
print("-----------------------------------")
both_criteria = series_custom[(series_custom > 50) & (series_custom < 75)]
print(both_criteria[0:5])

import pandas as pd
from pandas import Seriesfandango = pd.read_csv('fandango_score_comparison.csv')
rt_critics = Series(fandango['RottenTomatoes'].values, index=fandango['FILM'])
print(rt_critics[0:3])
rt_users = Series(fandango['RottenTomatoes_User'].values, index=fandango['FILM'])
print(rt_users[0:3])
rt_mean = (rt_critics + rt_users) / 2
print(rt_mean[0:3])


set_index

import pandas as pd
from pandas import Seriesfandango = pd.read_csv('fandango_score_comparison.csv')
# set_index 使用一个或多个现有列设置DataFrame索引(行标签)。默认情况下,生成一个新对象。
#       drop : boolean, default True 删除要用作新索引的列
fandango_films = fandango.set_index('FILM', drop=False)
print(fandango_films[0:3])

  • 当选择多个行时,返回一个DataFrame, 但当选择单个行时,返回的是一个Series对象
import pandas as pdfandango = pd.read_csv('fandango_score_comparison.csv')
fandango_films = fandango.set_index('FILM', drop=False)
# 使用括号表示法或loc[]进行切片
sub_films = fandango_films["Avengers: Age of Ultron (2015)":"Ant-Man (2015)"]
print(sub_films)
print(type(sub_films))
print("----------------------------------------------------")
sub_films = fandango_films.loc["Avengers: Age of Ultron (2015)":"Ant-Man (2015)"]
print(sub_films)
print(type(sub_films))
print("----------------------------------------------------")
# 查找特定的 movie
film = fandango_films.loc['Kumiko, The Treasure Hunter (2015)']
print(type(film))
print("----------------------------------------------------")
# 查找特定的 movie 列表
movies = ['Kumiko, The Treasure Hunter (2015)', 'Do You Believe? (2015)']
print(fandango_films.loc[movies])
print(type(fandango_films.loc[movies]))
# 当选择多个行时,返回一个DataFrame,
# 但当选择单个行时,返回的是一个Series对象

import pandas as pd
import numpy as npfandango = pd.read_csv('fandango_score_comparison.csv')
fandango_films = fandango.set_index('FILM', drop=False)
# panda中的apply()方法允许我们指定Python逻辑
# apply()方法需要传入一个矢量化操作
# 可以应用于每个系列对象。
# 以Series的形式返回数据类型
types = fandango_films.dtypes
# print(types) 返回所有的列名称
print(type(types))
print("----------------------------------------------------")
# 过滤数据类型为floats,索引属性只返回列名
float_columns = types[types.values == 'float64'].index
# 使用括号表示法过滤列,使其只是float列
float_df = fandango_films[float_columns]
print(float_df[0:3])
print(type(float_df))
print("----------------------------------------------------")
# “x”是表示列的系列对象
# numpy.std 计算沿指定轴的标准差。
deviations = float_df.apply(lambda x: np.std(x))
print(deviations[0:3])
print(type(deviations))
print("----------------------------------------------------")
rt_mt_user = float_df[['RT_user_norm', 'Metacritic_user_nom']]
deviations = rt_mt_user.apply(lambda x: np.std(x), axis=1)
print(deviations[0:3])


005.python科学计算库pandas(下)相关推荐

  1. 004.python科学计算库pandas(中)

    测试数据 titanic_train.csv isnull import pandastitanic_survival = pandas.read_csv("titanic_train.cs ...

  2. Python科学计算库 — Pandas数学统计方法

    首先导入pandas库 import numpy as np import pandas as pd Pandas 常用的数学统计方法如下表: 方法 说明 count 计算非NA值的数量 descri ...

  3. 【A-003】python数据分析与机器学习实战 Python科学计算库 Pandas数据分析处理库(二)

    目录: 处理缺失数据制作透视图删除含空数据的行和列多行索引使用apply函数 本节要处理的数据来自于泰坦尼克号的生存者名单,它的数据如下: PassengerId Survived Pclass .. ...

  4. 007.python科学计算库matplotlib(下)

    测试数据 fandango_scores.csv bar import matplotlib.pyplot as plt import pandas as pd from numpy import a ...

  5. Python科学计算库核心知识点总结_代码篇(ML/DL依赖语法)

    Python科学计算库核心知识点总结_代码篇(ML/DL依赖语法)                                                                    ...

  6. Python科学计算之Pandas基础学习

    Python科学计算之Pandas基础学习 导入Pandas 我们首先要导入我们的演出明星--Pandas. 这是导入Pandas的标准方式.显然,我们不希望每时每刻都在程序中写'pandas',但是 ...

  7. 初识 Python 科学计算库之 NumPy(创建多维数组对象)

    文章目录 参考 描述 NumPy 特点 获取 导入 多维数组对象 np.array() np.asarray() 范围 随机 概览 np.random.randn() np.random.normal ...

  8. 一文带你熟悉简单实用的Python科学计算库NumPy

    Python科学计算库NumPy 安装 数组的创建 array创建 **arange** 创建 **随机数创建** 方法numpy.random.random(size=None) 方法numpy.r ...

  9. python科学计算库-数值计算库与科学计算库

    BLAS 接口 BLAS , LAPACK , ATLAS 这些数值计算库的名字很类似,他们之间有什么关系呢?BLAS是一组线性代数运算接口,目前是事实上的标准,很多数值计算/科学计算都实现了这套接口 ...

最新文章

  1. BitLocker Partition Recovery
  2. 关于 SAP Spartacus 和 SmartEdit 集成的问题
  3. html弹出层全覆盖滚动条,JS弹出层遮罩,隐藏背景页面滚动条细节优化分析
  4. r语言t检验输出检验统计量_如何进行统计分析
  5. LibreOffice 6.4.4 发布
  6. GEE学习总结(3)——矢量面外接矩形和外包络面绘制与矢量数据导出
  7. 层次选择器[selector_2.html]
  8. 平行平板多光束干涉matlab,平行平板的多光束干涉.ppt
  9. 阿里云服务器centos7 安装docker 和docker-compose 及相关命令
  10. Java入门教程——下载JAVA
  11. MeScroll 移动端刷新,分页
  12. 【JavaWeb】用监听器实现单一登录
  13. 企业邮箱的优势有哪些?使用企业邮箱的好处
  14. html外链自动加nofollow,WordPress文章/页面外链自动添加nofollow属性的方法
  15. 华为否认提前发年终奖 网传消息实为销售激励计划
  16. Spring中的Interceptor拦截器中使用@Autowired注解,在运行时会出现空指针
  17. 操作系统实验三:主存空间的分配与回收
  18. 2022/12/17 mysql 索引基本原理解读
  19. oracle中索引的使用
  20. 渗透测试前的信息收集(玄魂磐石计划课件搬运)

热门文章

  1. python版坦克大战
  2. 基于labview的自动饮料售卖机
  3. 伴你装系统系列(下篇):Windows+Ubuntu+Kali三系统
  4. 智能数字温度计方案开发
  5. 【松子儿上班的那点事儿】持续打磨产品?屁股决定脑袋,抱歉我就是个打杂的...
  6. windows从e硬盘安装linux,【转】Windows7硬盘安装Linux
  7. 【再次提醒】送的40本豆瓣高评分Python书籍,后天就要开奖
  8. 牛人总结: 想入行嵌入式开发?要这样来规划
  9. 【13】SCI易中期刊推荐——计算机工程 | 电子与电气(中科院4区)
  10. foxmail邮件附件的打开方式_Foxmail通过附件打开对应邮件的技巧