波士顿房价预测实践(照搬学习)

  1. 第一步:相关库资源知识

下面展示一些 内联代码片

from sklearn.tree import DecisionTreeRegressor
from sklearn.ensemble import AdaBoostRegressor
from sklearn import datasets
from sklearn.metrics import mean_squared_error,explained_variance_score
from sklearn.utils import shuffle

scikit-learn简称sklearn,自2007年发布以来,sklearn已经成为Python重要的机器学习库了,支持包括分类,回归,降维和聚类四大机器学习算法。还包括了特征提取,数据处理和模型评估者三大模块。在这里主要用到四个模块tree:一个分类树模块,这里用到决策树
ensemble:这是一个组合几个模型结果用来增强泛化能力和鲁棒性的模块,主要一个目的是对几个独立模型的结果取均值,起到降低方差的作用。另一个目的是相继建立模型,后者降低前者偏差的作用。在这里,是选用第二个目的,利用AdaBoostRegressor函数。
datasets:sklearn自带的数据集,有这里用到的波士顿房价数据、鸢尾花、手写数字数据
自带数据用法:

sklearn.datasets.load_<name>#自带数据用法,将name改为目标名称
sklearn.datasets.fetch_<name>#在线下载数据集,将name改为目标名称

metrics:sklearn的一个评价指标模块
具体的用法:

from sklearn import metrics#直接导入整个模块
from sklearn.metrics import #导入具体的评价指标函数名称

 下面是一些评价指标函数:
平均绝对误差(mean absolute error):这是给定数据集的所有数据点的绝对误差平均 值。 
均方误差(mean squared error):这是给定数据集的所有数据点的误差的平方的平均值。 这是最流行的指标之一。 
中位数绝对误差(median absolute error):这是给定数据集的所有数据点的误差的中位 数。这个指标的主要优点是可以消除异常值(outlier)的干扰。测试数据集中的单个坏点 不会影响整个误差指标,均值误差指标会受到异常点的影响。 
解释方差分(explained variance score):这个分数用于衡量我们的模型对数据集波动 的解释能力。如果得分1.0分,那么表明我们的模型是完美的。
R方得分(R2 score):这个指标读作“R方”,是指确定性相关系数,用于衡量模型对未 知样本预测的效果。最好的得分是1.0,值也可以是负数。
 下面展示一些 内联代码片

housing_data = datasets.load_boston()#读取波士顿房价数据

下面展示一些 `housing_data.data#获取输入数据

X,Y = shuffle(housing_data.data,housing_data.target,random_state = 7)#打乱顺序
##//80%的数据用于训练,20%的数据用于测试
num_training = int(0.8*len(X))
X_train,Y_train = X[:num_training],Y[:num_training]
X_test,Y_test = X[num_training:],Y[num_training:]
#拟合一个决策树回归模型,这里设置为4
dt_regressor = DecisionTreeRegressor(max_depth = 4)
dt_regressor.fit(X_train,Y_train)
#带AdaBoost算法的决策树回归模型拟合
ab_regressor = AdaBoostRegressor(DecisionTreeRegressor(max_depth = 4),n_estimators=400,random_state = 7)
ab_regressor.fit(X_train,Y_train)#这里是对决策树的评价输出
Y_pred_dt = dt_regressor.predict(X_test)
mse = mean_squared_error(Y_test,Y_pred_dt)
evs = explained_variance_score(Y_test,Y_pred_dt)
print("\n### Decision Tree performance ### ")
#均方误差越小越好,所有数据点的误差的平方的平均值
print("Mean squared error = ",round(mse,2))
#解释方差分,越大越好,数据波动的解释能力
print("Explained variance score = ",round(evs,2))##这里是对带有AdaBoost算法的决策树的评价输出
Y_pred_ab = ab_regressor.predict(X_test)
mse = mean_squared_error(Y_test,Y_pred_ab)
evs = explained_variance_score(Y_test,Y_pred_ab)
print("\n### Decision Tree performance ###")
print("Mean aquared error = ",round(mse,2))
print("Explained variance ecore = ",round(evs,2))

波士顿房价预测实践(照搬学习)相关推荐

  1. 波士顿房价预测(TensorFlow2.9实践)

    波士顿房价预测(TensorFlow2.9实践) 波士顿房价数据集包括506个样本,每个样本包括12个特征变量和该地区的平均房价.房价(单价)显然和多个特征变量相关,不是单变量线性回归(一元线性回归) ...

  2. 深度学习经典入门项目—波士顿房价预测

    目录 房价预测--线性回归 数据处理 数据形状变换 数据集划分 数据归一化处理 housing.data数据格式 模型设计 线性回归模型设计 训练配置 训练过程 保存并测试模型 保存模型 测试模型 房 ...

  3. 【深度学习】实战Kaggle竞赛之线性模型解决波士顿房价预测问题(Pytorch)

    [深度学习]实战Kaggle竞赛之线性模型解决波士顿房价预测问题 文章目录 1 概述1.1 Competition Description1.2 Practice Skills 2 数据处理 3 训练 ...

  4. 教你使用百度深度学习框架PaddlePaddle完成波士顿房价预测(新手向)

    首先,本文是一篇纯新手向文章,我自己也只能算是入门,有说错的地方欢迎大家批评讨论 目录 一.人工智能.机器学习.深度学习 二.PaddlePaddle(飞桨) 三.波士顿房价预测模型 数据处理 模型设 ...

  5. 深度学习入门——波士顿房价预测

    基于神经网络模型的波士顿房价预测 波士顿房价预测是一个经典的机器学习任务,类似于程序员世界的"Hello World".以"波士顿房价预测"任务为例,我们学习如 ...

  6. 使用Python和Numpy进行波士顿房价预测任务(二)【深度学习入门_学习笔记】

    使用Python和Numpy进行波士顿房价预测任务–详解 目录: 一.数据处理 (1)读入数据 (2)数据形状变换 (3)数据集划分 (4)数据归一化处理 (5)封装成load data函数 二.模型 ...

  7. 深度学习:波士顿房价预测

    深度学习:波士顿房价预测 1.代码 #加载波士顿房价数据 import keras from keras.datasets import boston_housing (train_data,trai ...

  8. 统计学习基础:数据挖掘、推理和预测_百度零基础深度学习笔记(三) 波士顿房价预测...

    波士顿房价预测 波士顿房价预测是一个经典的机器学习任务,期待构建一个房价预测模型,其数据中包含13个影响房价的因素和该类型房屋均价. 波士顿房价影响因素 数据预处理 数据预处理包括: 数据导入 数据形 ...

  9. 机器学习线性回归实践,波士顿房价预测,手写梯度下降

    波士顿房价预测,手写梯度下降,python实现 数据集介绍 每条数据包含房屋以及房屋周围的详细信息.其中包含城镇犯罪率,一氧化氮浓度,住宅平均房间数,到中心区域的加权距离以及自住房平均房价等等. CR ...

  10. 深度学习(波士顿房价预测)

    本程序采用百度paddlepaddle深度学习框架,并在百度AI Studio平台上运行. 目录 1实验背景 2 实验过程 2.1 数据处理 2.1.1数据集导入并按规定形状保存 2.1.2数据集的划 ...

最新文章

  1. 每个程序员都需要学习 JavaScript 的7个理由
  2. 谷歌和伯克利分校的新工作:规模化大场景的神经绘制方法Block-NeRF
  3. 需求管理(3)------方法论
  4. Mybatis-Plus一个新的报错:数据库表名与SQL的关键字冲突!!!
  5. 第三章--堆栈段的工作方式
  6. 【分享预告】细数GAN和图像分类的前世今生
  7. boost::multiprecision模块complex128相关的测试程序
  8. 使用nodejs实现OData的batch操作在Marketing Cloud里读取contact信息
  9. 偏差与方差,欠拟合与过拟合
  10. 【Java线程】复盘线程池使用及思考
  11. 测试总结该怎么写...
  12. js模拟ps吸管吸取颜色功能
  13. 现代英语杂志现代英语杂志社现代英语编辑部2022年第6期目录
  14. java中int型的最大值_java int 的最大值 Integer.MAX_VALUE
  15. 新浪云 php,php在新浪云中使用imagick的方法
  16. 不安装运行时运行 .NET 程序 - NativeAOT
  17. centos7.5 挂载超过2T的大硬盘步骤
  18. 职高计算机应用基础学的什么,职高计算机应用基础教法初探
  19. 学习记录——微信小程序查询的两种方法
  20. android 动态修改dns,如何修改android手机上网DNS

热门文章

  1. 基于单片机的高精度厚度测量系统设计
  2. stm32mp157开发板LCD 显示测试触摸屏测试
  3. 基于nginx+consul-template+consul+springboot实现自动发现服务的集群
  4. 全网详解(波哥)Java8新特性(Lambda、Stream、LocalDate等)新特性
  5. Ubuntu14.04下中文输入法拼音不正常问题
  6. nodejs+vue+JavaScript火车高铁售票选座系统
  7. 记录一次数据库被黑,mysql,redis,mongodb各种修改密码修改端口添加白名单访问
  8. python假设产品列表如下_Django:我怎样才能得到一个模型来存储一个鞋码的列表(比如python或者其他的)...
  9. 一篇文章来相送 |心理学专业国内外高校排名及解析
  10. 某证券公司高级系统架构师内训圆满结束!