数据来源:
去到 https://stats.oecd.org/index.aspx?DataSetCode=BLI 下载数据,命名为BLI.csv 储存到notebook 创建的第一个项目相同的路径
去 http://goo.gl/j1MSKe 下载2015世界各国人均GDP数据,命名为WEO_Data.xls, 储存到相同路径





结果为bool值


import matplotlib
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
import sklearn# Load the data
oecd_bli = pd.read_csv("BLI.csv", thousands=',') #导入幸福指数文件,thousand是指若出现1000以上的数据去掉数字中的逗号,只保留数字
gdp_per_capita = pd.read_csv("gdp.csv",thousands=',',delimiter='\t',encoding='latin1', na_values="n/a")
#读取gdp数据,delimiter意为以制表符为分割,encoding指定编码方式,na_value读取到数据时,格式改为dataform中的na格式
oecd_bli.head() #将载入的幸福指数展现出来def prepare_country_stats(oecd_bli, gdp_per_capita):oecd_bli = oecd_bli[oecd_bli["INEQUALITY"]=="TOT"]#取列名称为INEQUALITY里面元素为TOT那一行所有的元素oecd_bli = oecd_bli.pivot(index="Country",columns="Indicator",value="Value")print(oecd_bli.head(1))gdp_per_capite.rename(columns={"2015":"GDP per capita"},inplace=True)#将2015列名改为GDP per capita,inplace=true表示在原来的数据中修改,若等于false则会有一个返回值gdp_per_capite.set_index("Country",inplace=True)#country列变成一个索引的形式full_country_stats = pd.merge(left=oecd_bli,right=gdp_per_capite,left_index=True,right_index=True)#merge连接函数,以country为媒介,left取oecd_bli,right同理取gdp_per_capite,index=true表示都保留原来的indexfull_country_stats.sort_values(by="GDP per capita",inplace=True)#根据GDP per capita的值进行排序,默认从小到大排列remove_indices = [0,1,6,8,33,34,35]#移除空的索引keep_indices = list(set(range(36)) - set(remove_indices))#前36个国家里面减去空的索引return full_country_stats[["GDP per capita",'Life satisfaction']].iloc[keep_indices]#iloc切片,保留下来两列数据# Prepare the data
country_stats = prepare_country_stats(oecd_bli, gdp_per_capita)
#调用函数
X = np.c_[country_stats["GDP per capita"]]
y = np.c_[country_stats["Life satisfaction"]]
#np.c_把数据中这一列转化称为numpy底下的array形式# Visualize the data
country_stats.plot(kind='scatter', x="GDP per capita", y='Life satisfaction')
plt.show()
#画散点图# Select a linear model
from sklearn import linear_model
lin_reg_model = sklearn.linear_model.LinearRegression()
#引用模型,一个实例# Train the model
lin_reg_model.fit(X, y)# Make a prediction for Cyprus
X_new = [[22587]] # Cyprus' GDP per capita
print(lin_reg_model.predict(X_new)) # outputs [[ 5.96242338]]
#用新的二维数组进行预测

连接结果

sort函数

如果直接拿的话,格式不是一个矩阵类型

但对它进行操作之后

幸福指数与GDP线性拟合相关推荐

  1. GDP越高就越幸福吗?用Python分析《世界幸福指数报告》后我们发现…

    公众号后台回复"图书",了解更多号主新书内容 作者:CDA数据分析师 来源:CDA数据分析师  CDA数据分析师 出品   作者:真达.Mika 数据:真达   [导读] 今天教大 ...

  2. matlab指数转换,[转]MATLAB 线性拟合与指数拟合

    线性拟合如下: ------------------------------------------------------------------ x=[0 20 40 60 100 130 160 ...

  3. 多元线性回归预测国家幸福指数

    多元线性回归 之前复现了单特征预测幸福指数的线性回归模型, 现在使用多向量特征回归看看是否会减小误差 导库与查看数据 import numpy as np import pandas as pd im ...

  4. 使用R语言分析世界幸福指数

    使用R语言分析世界幸福指数 本文中的数据为2019年的世界幸福指数报告,数据来源于kaggle. 数据详情 数据包含9个字段: Rank: 排名 Country or Region: 国家或地区 Sc ...

  5. 用Python分析幸福指数

    作者:huny https://www.cnblogs.com/huny/p/14146719.html 世界上最幸福的国家有哪些?个人幸福和哪些指标相关?你幸福吗?如果不知道,那就进来看看这篇关于幸 ...

  6. 分析哪个国家在总体幸福指数上排名最高,中国居然80名以外?

    本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 以下文章来源于CDA数据分析师 ,作者CDA数据分析师 前言 <世界幸福指 ...

  7. 【视频】KMEANS均值聚类和层次聚类:R语言分析生活幸福指数可视化|数据分享...

    原文链接:http://tecdat.cn/?p=24198 聚类是将总体或数据点划分为多个组的任务,以使同一组中的数据点与同一组中的其他数据点更相似,而与其他组中的数据点不相似.它基本上是基于它们之 ...

  8. 用python的numpy作线性拟合、多项式拟合、对数拟合

    转自:http://blog.itpub.net/12199764/viewspace-1743145/ 项目中有涉及趋势预测的工作,整理一下这3种拟合方法: 1.线性拟合-使用math import ...

  9. 不丹的启示:用国民幸福总值替代GDP

    不丹的启示:用国民幸福总值替代GDP 美国发展模式在金融海啸中破灭,"生美国"时代的的反省和探索很可能催生一次社会发展模式的思想革命. 超越GDP 近年来,虽然中国的GDP获得了高 ...

最新文章

  1. 青龙羊毛——梅川衣服俩小孩(搬)
  2. Ant Design Pro 改变默认启动端口号
  3. java除号_Java的运算符
  4. 微信录音滑动撤销 html5,微信中这个被取消的功能悄悄上线了,将语音上滑即可转换成文字...
  5. 好文!2020届最新互联网校招薪资大全!
  6. php内置web server
  7. 钢琴调律经验(菜鸟版)
  8. 小米路由器4a开发版固件_发现篇免拆刷小米路由器4a千兆版刷第三方固件的贴子!...
  9. 无人车之美——论无人车辆系统的软件架构
  10. CSS揭秘读书笔记-第一章 引言
  11. Widedeep模型详解
  12. 64位机器与32位机器的区别
  13. 渗透测试的理论部分1——渗透测试方法论
  14. 大榕树BASIS QQ群
  15. 计算机主机拆装ppt模板,计算机拆装步骤222.ppt
  16. 有python画螺旋线
  17. 毕业设计之基于springboot的开源商城系统
  18. 蓝汛之5376脚位图
  19. 教你疾速驾驭DB2数据库中的相关饬令-3
  20. SEED RL — 大规模扩展强化学习

热门文章

  1. Python爬虫实战——爬取RUNOOB.COM的Python3教程
  2. php中文网培训讲师,按照老师的写的
  3. 无需插件用Chrome调试WebView加载的网页
  4. Python学习(01-09day)
  5. 2018年东北农业大学春季校赛 题解
  6. bullet java_Bullet 学习笔记之 Bullet User Manual
  7. E+H限位开关FTL31-AA4U3BAXDJZ1
  8. 0x80070035(0x80070035找不到网络路径 共享打印机)
  9. Linux远程唤醒Windows
  10. linux---破解root口令