【机器学习实战】线性回归之北京市住房价格预测
文章目录
- 数据集读取与划分
- 数据集读取
- 数据集划分
- 模型训练及预测
- 模型评价
数据集读取与划分
数据集读取
import pandas as pd### 代码开始 ### (≈ 2 行代码)
df=pd.read_csv("https://labfile.oss.aliyuncs.com/courses/1081/challenge-1-beijing.csv")
df.head()
### 代码结束 ###
数据集划分
features = df[['公交','写字楼','医院','商场','地铁','学校','建造时间','楼层','面积']]
target = df['每平米价格']
split_num = int(len(df)*0.7) # 70% 分割数
X_train = features[:split_num]# 训练集特征
y_train = target[:split_num]# 训练集目标
X_test = features[split_num:]# 测试集特征
y_test = target[split_num:]# 测试集目标
模型训练及预测
from sklearn.linear_model import LinearRegression### 代码开始 ### (≈ 2 行代码)
model = LinearRegression()# 模型
model.fit(X_train, y_train)# 模型训练
### 代码结束 ###
模型评价
平均绝对百分比误差MAPE 是一个百分比值,因此比其他统计量更容易理解。例如,如果 MAPE 为 5,则表示预测结果较真实结果平均偏离
5%。MAPE 的计算公式如下: MAPE(y,y^)=∑i=1n∣yi−y^iyi∣n×100\textrm{MAPE}(y, \hat{y} ) = \frac{\sum_{i=1}^{n}{|\frac{y_{i}-\hat y_{i}}{y_{i}}|}}{n} \times 100 MAPE(y,y^)=n∑i=1n∣yiyi−y^i∣×100
其中,yiy_{i}yi 表示真实值,y^i\hat y_{i}y^i 表示预测值,nnn 则表示值的个数。MAPE 的值越小,说明预测模型拥有更好的精确度。
import numpy as npdef mape(y_true, y_pred):"""参数:y_true -- 测试集目标真实值y_pred -- 测试集目标预测值返回:mape -- MAPE 评价指标"""mape = sum(np.abs((y_true-y_pred)/y_true))/len(y_true)*100return mape
y_true = y_test.values# 测试集目标
y_pred = model.predict(X_test)# 预测结果
mape(y_true, y_pred)# 平均绝对百分比误差
输出:45.5061885467624
可以看到,最终得到的 MAPE 值较大,意味着预测的偏移量较大。在线性回归实验中,我们提到预测结果较差的一个原因可能是数据没有经过预处理。除此之外,线性回归本身就是一种非常基础简单的预测方法。对于房价这种包含多个特征的预测问题,我们往往要使用更复杂的方法来进行回归预测才能得到更好的结果。
【机器学习实战】线性回归之北京市住房价格预测相关推荐
- 机器学习项目实战(五) 住房价格预测
机器学习项目实战系列 住房价格预测 目录 机器学习项目实战系列 住房价格预测 一.概述 二.分析数据 1.数据导入 2.基础统计运算 3.特征观察 4.建立模型 5.分析模型表现 (1)学习曲 ...
- 【阿旭机器学习实战】【36】糖尿病预测---决策树建模及其可视化
[阿旭机器学习实战]系列文章主要介绍机器学习的各种算法模型及其实战案例,欢迎点赞,关注共同学习交流. [阿旭机器学习实战][36]糖尿病预测-决策树建模及其可视化 目录 [阿旭机器学习实战][36]糖 ...
- 机器学习实战——线性回归和局部加权线性回归(含python中复制的四种情形!)
书籍:<机器学习实战>中文版 IDE:PyCharm Edu 4.02 环境:Adaconda3 python3.6 注:本程序相比原书中的程序区别,主要区别在于函数验证和绘图部分. 一 ...
- 机器学习实战-微额借款用户人品预测
团队分享网址 1.项目背景 互联网金融近年来异常火热,吸引了大量资本和人才进入. 在金融领域中,无论是投资理 财还是借贷放款,风险控制永远是最为核心和重要的问题,而存目前所有的互联网金融产品 中,微额 ...
- B.机器学习实战系列[一]:工业蒸汽量预测(最新版本下篇)重点讲解模型验证、特征优化、模型融合等
[机器学习入门与实践]入门必看系列,含数据挖掘项目实战:数据融合.特征优化.特征降维.探索性分析等,实战带你掌握机器学习数据挖掘 专栏详细介绍:[机器学习入门与实践]合集入门必看系列,含数据挖掘项目实 ...
- 机器学习实战 | 意大利Covid-19病毒感染数学模型及预测(附代码)
来源:DeepHub IMBA 本文约2400字,建议阅读9分钟 本文将用Python展示感染增长的简单数学分析和两个模型,以更好地理解感染的演变. 标签:机器学习 当今世界正在与一个新的敌人作斗争, ...
- 机器学习实战_朴素贝叶斯分类器_预测疾病
import numpy as np""" 函数说明:创建实验样本 Parameters:无 Returns:postingList - 实验样本切分的词条classLi ...
- Python数据处理课程设计-房屋价格预测
注:可能有些图片未能成功上传,可在文档处进行下载 链接:Python数据处理课程设计-房屋价格预测-机器学习文档类资源-CSDN下载 课程设计报告 课程名称 Python数据处理课程设计 项目名称 房 ...
- 住房月租金预测大数据赛
[Python数据分析实战项目]之 住房月租金预测大数据赛分析|详解 注:图片源于http://www.dcjingsai.com 完整源代码及训练测试集数据请使劲戳 ☛☛ https://githu ...
最新文章
- Git的撤销操作 git reset HEAD -- <file>
- js怎么获取访问页数记录(知道的能不能告诉我一下)
- TypeScript学习笔记1:变量赋值及书写方式
- linux awk命令使用示例
- 对用户密码进行md5加密的代码实现
- 开发自定义控件的笔记 (2)
- 想靠大数据创业 你需要了解什么
- 计算机大赛横幅标语有趣的,有趣的横幅标语
- centos下使用yum命令安装php mcrypt扩展
- idea 15 license server
- 一名亚马逊软件工程师的辛酸苦楚
- Spring知识点一站到底(转载)
- C程序设计--指针(用 “ 函数 ” 对 “ 多维数组 ” 进行操作)
- 计算机03年word做母亲节贺卡,制作图文并茂的作品---用word制作母亲节贺卡PPT课件...
- 十二属相配对与最佳配偶
- ios : Provision Profile 添加设备 device的 udid
- JavaDay29 CSS
- nginx-http重定向到https配置
- Maven_怎么查看maven本地仓库地址
- 从法律角度看数据安全,数据销毁很重要