目录

  • 1. 导入必要的库
  • 2. 按照如下的元数据内容创建数据集
  • 3. 将上述的数据框分别命名为data1,data2和data3
  • 4. 将data1和data2两个数据框按照行的维度进行合并,命名为all_data
  • 5. 将data1和data2按照列的维度进行合并,命名为all_data_col
  • 6. 按照subject_id的值对all_data和data3做合并
  • 7. 对data1和data2按照subject_id作连接
  • 8. 找到data1和data2合并之后的所有匹配结果

题目数据来源: https://www.kesci.com/mw/notebook/5c1b599d8859e0002b718378

1. 导入必要的库

import pandas as pd

2. 按照如下的元数据内容创建数据集

raw_data_1 = {'subject_id': ['1', '2', '3', '4', '5'],'first_name': ['Alex', 'Amy', 'Allen', 'Alice', 'Ayoung'], 'last_name': ['Anderson', 'Ackerman', 'Ali', 'Aoni', 'Atiches']}raw_data_2 = {'subject_id': ['4', '5', '6', '7', '8'],'first_name': ['Billy', 'Brian', 'Bran', 'Bryce', 'Betty'], 'last_name': ['Bonder', 'Black', 'Balwner', 'Brice', 'Btisan']}raw_data_3 = {'subject_id': ['1', '2', '3', '4', '5', '7', '8', '9', '10', '11'],'test_id': [51, 15, 15, 61, 16, 14, 15, 1, 61, 16]}

3. 将上述的数据框分别命名为data1,data2和data3

data1 = pd.DataFrame(raw_data_1, columns = ['subject_id', 'first_name', 'last_name'])
data2 = pd.DataFrame(raw_data_2, columns = ['subject_id', 'first_name', 'last_name'])
data3 = pd.DataFrame(raw_data_3, columns = ['subject_id','test_id'])

4. 将data1和data2两个数据框按照行的维度进行合并,命名为all_data

all_data = pd.concat([data1, data2])all_data# pd.concat([data1, data2], axis=0)  默认是按行的维度合并(上下拼接)

5. 将data1和data2按照列的维度进行合并,命名为all_data_col

all_data_col = pd.concat([data1, data2], axis=1)all_data_col

6. 按照subject_id的值对all_data和data3做合并

pd.merge(all_data, data3, on='subject_id')

7. 对data1和data2按照subject_id作连接

pd.merge(data1, data2, how='inner', left_on='subject_id', right_on='subject_id')

8. 找到data1和data2合并之后的所有匹配结果

pd.merge(data1, data2, how='outer', on='subject_id')

kesci-这十套练习,教你如何使用Pandas做数据分析-练习5(学习笔记)相关推荐

  1. 这十套练习,教你如何用Pandas做数据分析

    最新工作比较忙,python这块搁置了好久都没有好好学习以及更新相关学习笔记,立下flag,争取两天更新一个练习题,到十一月初更新完这块内容 练习1-开始了解你的数据(2021-11-02已完成) 练 ...

  2. kesci-这十套练习,教你如何使用Pandas做数据分析-练习2(学习笔记)

    题目数据来源:https://www.kesci.com/mw/notebook/5c1b599d8859e0002b718378 数据过滤与排序 -- 探索2012欧洲杯数据 1. 导入必要的库 2 ...

  3. kesci-这十套练习,教你如何使用Pandas做数据分析-练习3(学习笔记)

    题目数据来源:https://www.kesci.com/mw/notebook/5c1b599d8859e0002b718378 数据分组 -- 探索酒类消费数据 1. 导入必要的库 2. 加载数据 ...

  4. kesci-这十套练习,教你如何使用Pandas做数据分析-练习1(学习笔记)

    题目数据来源:https://www.kesci.com/mw/notebook/5c1b599d8859e0002b718378 了解你的数据 -- 探索Chipotle快餐数据 1. 导入需要的库 ...

  5. kesci-这十套练习,教你如何使用Pandas做数据分析-练习4(学习笔记)

    题目数据来源:https://www.kesci.com/mw/notebook/5c1b599d8859e0002b718378 目录 1. 导入库 2. 加载数据 3. 每一列(columns)的 ...

  6. python新手入门教程思路-Python新手入门教程_教你怎么用Python做数据分析

    Python新手入门教程_教你怎么用Python做数据分析 跟大家讲了这么多期的Python教程,有小伙伴在学Python新手教程的时候说学Python比较复杂的地方就是资料太多了,比较复杂.很多网上 ...

  7. 2组语法,1个函数,教你学会用Python做数据分析!

    前言 和很多同学接触过程中,我发现自学Python数据分析的一个难点是资料繁多,过于复杂.大部分网上的资料总是从Python语法教起,夹杂着大量Python开发的知识点,花了很多时间却始终云里雾里,不 ...

  8. OpenCV学习笔记(三十六)——Kalman滤波做运动目标跟踪 OpenCV学习笔记(三十七)——实用函数、系统函数、宏core OpenCV学习笔记(三十八)——显示当前FPS OpenC

    OpenCV学习笔记(三十六)--Kalman滤波做运动目标跟踪 kalman滤波大家都很熟悉,其基本思想就是先不考虑输入信号和观测噪声的影响,得到状态变量和输出信号的估计值,再用输出信号的估计误差加 ...

  9. Kesci的十套数据分析练习笔记练习1-开始了解你的数据练习2-数据过滤与排序练习3-数据分组练习4-Apply函数练习5-合并练习6-统计练习7-可视化练习8-创建数据框练习9-时间序列练习10-删

    练习题Kesci链接: [ link ](https://www.kesci.com/home/project/59e77a636d213335f38daec2) 文章目录 练习1-开始了解你的数据 ...

最新文章

  1. Raft -【go一致性算法】
  2. python教学视频q_#python如何用pyqt5打开视频(还有PPT)并输出到QLabel上?#python怎么运行视屏教程...
  3. unityios开发--Scorll View控件 .
  4. oracle数据库卡住了无法保存,Oracle数据库使用NFS存储,启动报错提示无法锁定文件...
  5. Bailian2888 字符串中的数字【字符串】
  6. PLSQL如何将千万数据快速插入到另一张表中_数据库设计中的 9 大常见错误
  7. 基于SSM的手机商城
  8. Windows/Mac系统MySQL,MySQL驱动下载和安装
  9. HTML5网页设计 (一)
  10. 企信下载的文件在哪里_Foobar2000(无损音乐播放器下载)(软件篇)
  11. 动态规划之二项式系数
  12. strstr函数实现(C语言)
  13. 计算机中的位,字节,字,字长的概念
  14. 原生js实现点名册效果
  15. Jodd-Java的瑞士军刀 demo
  16. Oracle批量清空表数据
  17. C/C++获取时间及时间格式转换
  18. 微信支付开发教程(公众号支付)
  19. 3.9 Docker最新入门教程-Docker入门-构建镜像最佳实践
  20. html中label文本垂直居中,如何在VB中实现label中的文字垂直方向居中?

热门文章

  1. SQL美化dll,C#
  2. 致准大一新生:上大学前,你需要知道的几件事
  3. animation 自定义动画
  4. Vue自定义动画/过渡
  5. Domestic Altcoins Hard to Turn Over
  6. 私家典藏--京酱肉丝
  7. win10禁用更新和清理更新文件
  8. 新手入门必备,分享5个自媒体实用工具,效率和收益都翻倍
  9. vendor.js低于500k,上传显示超过500k
  10. python高并发对比java_Java和Python哪个前景更好点呢?