文章目录

  • 数据集读取与划分
    • 数据集读取
    • 数据集划分
  • 模型训练及预测
  • 模型评价

数据集读取与划分

数据集读取

import pandas as pd### 代码开始 ### (≈ 2 行代码)
df=pd.read_csv("https://labfile.oss.aliyuncs.com/courses/1081/challenge-1-beijing.csv")
df.head()
### 代码结束 ###

数据集划分

features = df[['公交','写字楼','医院','商场','地铁','学校','建造时间','楼层','面积']]
target = df['每平米价格']
split_num = int(len(df)*0.7) # 70% 分割数
X_train = features[:split_num]# 训练集特征
y_train = target[:split_num]# 训练集目标
X_test = features[split_num:]# 测试集特征
y_test = target[split_num:]# 测试集目标

模型训练及预测

from sklearn.linear_model import LinearRegression### 代码开始 ### (≈ 2 行代码)
model = LinearRegression()# 模型
model.fit(X_train, y_train)# 模型训练
### 代码结束 ###

模型评价

平均绝对百分比误差MAPE 是一个百分比值,因此比其他统计量更容易理解。例如,如果 MAPE 为 5,则表示预测结果较真实结果平均偏离
5%。MAPE 的计算公式如下: MAPE(y,y^)=∑i=1n∣yi−y^iyi∣n×100\textrm{MAPE}(y, \hat{y} ) = \frac{\sum_{i=1}^{n}{|\frac{y_{i}-\hat y_{i}}{y_{i}}|}}{n} \times 100 MAPE(y,y^​)=n∑i=1n​∣yi​yi​−y^​i​​∣​×100
其中,yiy_{i}yi​ 表示真实值,y^i\hat y_{i}y^​i​ 表示预测值,nnn 则表示值的个数。MAPE 的值越小,说明预测模型拥有更好的精确度。

import numpy as npdef mape(y_true, y_pred):"""参数:y_true -- 测试集目标真实值y_pred -- 测试集目标预测值返回:mape -- MAPE 评价指标"""mape = sum(np.abs((y_true-y_pred)/y_true))/len(y_true)*100return mape
y_true = y_test.values# 测试集目标
y_pred = model.predict(X_test)# 预测结果
mape(y_true, y_pred)# 平均绝对百分比误差

输出:45.5061885467624
可以看到,最终得到的 MAPE 值较大,意味着预测的偏移量较大。在线性回归实验中,我们提到预测结果较差的一个原因可能是数据没有经过预处理。除此之外,线性回归本身就是一种非常基础简单的预测方法。对于房价这种包含多个特征的预测问题,我们往往要使用更复杂的方法来进行回归预测才能得到更好的结果。

【机器学习实战】线性回归之北京市住房价格预测相关推荐

  1. 机器学习项目实战(五) 住房价格预测

    机器学习项目实战系列   住房价格预测 目录 机器学习项目实战系列   住房价格预测 一.概述 二.分析数据 1.数据导入 2.基础统计运算 3.特征观察 4.建立模型 5.分析模型表现 (1)学习曲 ...

  2. 【阿旭机器学习实战】【36】糖尿病预测---决策树建模及其可视化

    [阿旭机器学习实战]系列文章主要介绍机器学习的各种算法模型及其实战案例,欢迎点赞,关注共同学习交流. [阿旭机器学习实战][36]糖尿病预测-决策树建模及其可视化 目录 [阿旭机器学习实战][36]糖 ...

  3. 机器学习实战——线性回归和局部加权线性回归(含python中复制的四种情形!)

    书籍:<机器学习实战>中文版 IDE:PyCharm Edu 4.02 环境:Adaconda3  python3.6 注:本程序相比原书中的程序区别,主要区别在于函数验证和绘图部分. 一 ...

  4. 机器学习实战-微额借款用户人品预测

    团队分享网址 1.项目背景 互联网金融近年来异常火热,吸引了大量资本和人才进入. 在金融领域中,无论是投资理 财还是借贷放款,风险控制永远是最为核心和重要的问题,而存目前所有的互联网金融产品 中,微额 ...

  5. B.机器学习实战系列[一]:工业蒸汽量预测(最新版本下篇)重点讲解模型验证、特征优化、模型融合等

    [机器学习入门与实践]入门必看系列,含数据挖掘项目实战:数据融合.特征优化.特征降维.探索性分析等,实战带你掌握机器学习数据挖掘 专栏详细介绍:[机器学习入门与实践]合集入门必看系列,含数据挖掘项目实 ...

  6. 机器学习实战 | 意大利Covid-19病毒感染数学模型及预测(附代码)

    来源:DeepHub IMBA 本文约2400字,建议阅读9分钟 本文将用Python展示感染增长的简单数学分析和两个模型,以更好地理解感染的演变. 标签:机器学习 当今世界正在与一个新的敌人作斗争, ...

  7. 机器学习实战_朴素贝叶斯分类器_预测疾病

    import numpy as np""" 函数说明:创建实验样本 Parameters:无 Returns:postingList - 实验样本切分的词条classLi ...

  8. Python数据处理课程设计-房屋价格预测

    注:可能有些图片未能成功上传,可在文档处进行下载 链接:Python数据处理课程设计-房屋价格预测-机器学习文档类资源-CSDN下载 课程设计报告 课程名称 Python数据处理课程设计 项目名称 房 ...

  9. 住房月租金预测大数据赛

    [Python数据分析实战项目]之 住房月租金预测大数据赛分析|详解 注:图片源于http://www.dcjingsai.com 完整源代码及训练测试集数据请使劲戳 ☛☛ https://githu ...

最新文章

  1. Git的撤销操作 git reset HEAD -- <file>
  2. js怎么获取访问页数记录(知道的能不能告诉我一下)
  3. TypeScript学习笔记1:变量赋值及书写方式
  4. linux awk命令使用示例
  5. 对用户密码进行md5加密的代码实现
  6. 开发自定义控件的笔记 (2)
  7. 想靠大数据创业 你需要了解什么
  8. 计算机大赛横幅标语有趣的,有趣的横幅标语
  9. centos下使用yum命令安装php mcrypt扩展
  10. idea 15 license server
  11. 一名亚马逊软件工程师的辛酸苦楚
  12. Spring知识点一站到底(转载)
  13. C程序设计--指针(用 “ 函数 ” 对 “ 多维数组 ” 进行操作)
  14. 计算机03年word做母亲节贺卡,制作图文并茂的作品---用word制作母亲节贺卡PPT课件...
  15. 十二属相配对与最佳配偶
  16. ios : Provision Profile 添加设备 device的 udid
  17. JavaDay29 CSS
  18. nginx-http重定向到https配置
  19. Maven_怎么查看maven本地仓库地址
  20. 从法律角度看数据安全,数据销毁很重要

热门文章

  1. K-S检验法判断数据分布类型
  2. 如何用记事本编写java
  3. 主页面弹框之后返回主页面并且刷新信息(详细讲解)
  4. 生死簿后台管理系统(有趣、放松下大脑)
  5. android培训课程开始了
  6. 来着 FBI 的 WARNING
  7. poj 1089 Intervals
  8. 硅酸钙(CS)保温材料英国UKCA认证 - EN 14306
  9. Matlab Simulink 时间戳、采样率、Demux理解
  10. “股神”巴菲特的六大投资良策