kesci-这十套练习,教你如何使用Pandas做数据分析-练习5(学习笔记)
目录
- 1. 导入必要的库
- 2. 按照如下的元数据内容创建数据集
- 3. 将上述的数据框分别命名为data1,data2和data3
- 4. 将data1和data2两个数据框按照行的维度进行合并,命名为all_data
- 5. 将data1和data2按照列的维度进行合并,命名为all_data_col
- 6. 按照subject_id的值对all_data和data3做合并
- 7. 对data1和data2按照subject_id作连接
- 8. 找到data1和data2合并之后的所有匹配结果
题目数据来源: https://www.kesci.com/mw/notebook/5c1b599d8859e0002b718378
1. 导入必要的库
import pandas as pd
2. 按照如下的元数据内容创建数据集
raw_data_1 = {'subject_id': ['1', '2', '3', '4', '5'],'first_name': ['Alex', 'Amy', 'Allen', 'Alice', 'Ayoung'], 'last_name': ['Anderson', 'Ackerman', 'Ali', 'Aoni', 'Atiches']}raw_data_2 = {'subject_id': ['4', '5', '6', '7', '8'],'first_name': ['Billy', 'Brian', 'Bran', 'Bryce', 'Betty'], 'last_name': ['Bonder', 'Black', 'Balwner', 'Brice', 'Btisan']}raw_data_3 = {'subject_id': ['1', '2', '3', '4', '5', '7', '8', '9', '10', '11'],'test_id': [51, 15, 15, 61, 16, 14, 15, 1, 61, 16]}
3. 将上述的数据框分别命名为data1,data2和data3
data1 = pd.DataFrame(raw_data_1, columns = ['subject_id', 'first_name', 'last_name'])
data2 = pd.DataFrame(raw_data_2, columns = ['subject_id', 'first_name', 'last_name'])
data3 = pd.DataFrame(raw_data_3, columns = ['subject_id','test_id'])
4. 将data1和data2两个数据框按照行的维度进行合并,命名为all_data
all_data = pd.concat([data1, data2])all_data# pd.concat([data1, data2], axis=0) 默认是按行的维度合并(上下拼接)
5. 将data1和data2按照列的维度进行合并,命名为all_data_col
all_data_col = pd.concat([data1, data2], axis=1)all_data_col
6. 按照subject_id的值对all_data和data3做合并
pd.merge(all_data, data3, on='subject_id')
7. 对data1和data2按照subject_id作连接
pd.merge(data1, data2, how='inner', left_on='subject_id', right_on='subject_id')
8. 找到data1和data2合并之后的所有匹配结果
pd.merge(data1, data2, how='outer', on='subject_id')
kesci-这十套练习,教你如何使用Pandas做数据分析-练习5(学习笔记)相关推荐
- 这十套练习,教你如何用Pandas做数据分析
最新工作比较忙,python这块搁置了好久都没有好好学习以及更新相关学习笔记,立下flag,争取两天更新一个练习题,到十一月初更新完这块内容 练习1-开始了解你的数据(2021-11-02已完成) 练 ...
- kesci-这十套练习,教你如何使用Pandas做数据分析-练习2(学习笔记)
题目数据来源:https://www.kesci.com/mw/notebook/5c1b599d8859e0002b718378 数据过滤与排序 -- 探索2012欧洲杯数据 1. 导入必要的库 2 ...
- kesci-这十套练习,教你如何使用Pandas做数据分析-练习3(学习笔记)
题目数据来源:https://www.kesci.com/mw/notebook/5c1b599d8859e0002b718378 数据分组 -- 探索酒类消费数据 1. 导入必要的库 2. 加载数据 ...
- kesci-这十套练习,教你如何使用Pandas做数据分析-练习1(学习笔记)
题目数据来源:https://www.kesci.com/mw/notebook/5c1b599d8859e0002b718378 了解你的数据 -- 探索Chipotle快餐数据 1. 导入需要的库 ...
- kesci-这十套练习,教你如何使用Pandas做数据分析-练习4(学习笔记)
题目数据来源:https://www.kesci.com/mw/notebook/5c1b599d8859e0002b718378 目录 1. 导入库 2. 加载数据 3. 每一列(columns)的 ...
- python新手入门教程思路-Python新手入门教程_教你怎么用Python做数据分析
Python新手入门教程_教你怎么用Python做数据分析 跟大家讲了这么多期的Python教程,有小伙伴在学Python新手教程的时候说学Python比较复杂的地方就是资料太多了,比较复杂.很多网上 ...
- 2组语法,1个函数,教你学会用Python做数据分析!
前言 和很多同学接触过程中,我发现自学Python数据分析的一个难点是资料繁多,过于复杂.大部分网上的资料总是从Python语法教起,夹杂着大量Python开发的知识点,花了很多时间却始终云里雾里,不 ...
- OpenCV学习笔记(三十六)——Kalman滤波做运动目标跟踪 OpenCV学习笔记(三十七)——实用函数、系统函数、宏core OpenCV学习笔记(三十八)——显示当前FPS OpenC
OpenCV学习笔记(三十六)--Kalman滤波做运动目标跟踪 kalman滤波大家都很熟悉,其基本思想就是先不考虑输入信号和观测噪声的影响,得到状态变量和输出信号的估计值,再用输出信号的估计误差加 ...
- Kesci的十套数据分析练习笔记练习1-开始了解你的数据练习2-数据过滤与排序练习3-数据分组练习4-Apply函数练习5-合并练习6-统计练习7-可视化练习8-创建数据框练习9-时间序列练习10-删
练习题Kesci链接: [ link ](https://www.kesci.com/home/project/59e77a636d213335f38daec2) 文章目录 练习1-开始了解你的数据 ...
最新文章
- Raft -【go一致性算法】
- python教学视频q_#python如何用pyqt5打开视频(还有PPT)并输出到QLabel上?#python怎么运行视屏教程...
- unityios开发--Scorll View控件 .
- oracle数据库卡住了无法保存,Oracle数据库使用NFS存储,启动报错提示无法锁定文件...
- Bailian2888 字符串中的数字【字符串】
- PLSQL如何将千万数据快速插入到另一张表中_数据库设计中的 9 大常见错误
- 基于SSM的手机商城
- Windows/Mac系统MySQL,MySQL驱动下载和安装
- HTML5网页设计 (一)
- 企信下载的文件在哪里_Foobar2000(无损音乐播放器下载)(软件篇)
- 动态规划之二项式系数
- strstr函数实现(C语言)
- 计算机中的位,字节,字,字长的概念
- 原生js实现点名册效果
- Jodd-Java的瑞士军刀 demo
- Oracle批量清空表数据
- C/C++获取时间及时间格式转换
- 微信支付开发教程(公众号支付)
- 3.9 Docker最新入门教程-Docker入门-构建镜像最佳实践
- html中label文本垂直居中,如何在VB中实现label中的文字垂直方向居中?