机器学习 房产价格预测
github地址 : github.com/yangjinghit…
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline
复制代码
data1 = pd.read_csv('lianjia1.csv', encoding='gbk')
data2 = pd.read_csv('lianjia2.csv', encoding='gbk')
data3 = pd.read_csv('lianjia3.csv', encoding='utf-8')
data4 = pd.read_csv('lianjia4.csv', encoding='utf-8')
data5 = pd.read_csv('lianjia5.csv', encoding='utf-8')
data6 = pd.read_csv('lianjia6.csv', encoding='utf-8')
data7 = pd.read_csv('lianjia7.csv', encoding='utf-8')
复制代码
data = pd.concat([data1, data2, data3, data4, data5,data6,data7])
复制代码
len(data)
复制代码
162227
复制代码
data = data.dropna()
复制代码
len(data)
复制代码
144531
复制代码
data.cjdanjia = np.round(data.cjdanjia.str.replace('元/平','').astype(np.float32).map(lambda x: x/10000), 2)
复制代码
data.cjshijian = pd.to_datetime(data.cjshijian.map(lambda x :x[5:]))
复制代码
data = data[data.cjxiaoqu.str.contains('远洋山水')]
复制代码
data = data.sort_values(by='cjshijian')
复制代码
data.set_index('cjshijian', inplace=True)
复制代码
data = data['2012':]
复制代码
#data.set_index('cjshijian',inplace=True)['2012':]
复制代码
data = data[data.cjdanjia > 1]
复制代码
data.head(3)
复制代码
cjtaoshu | mendian | cjzongjia | zhiwei | haoping | cjdanjia | cjxiaoqu | xingming | cjzhouqi | biaoqian | cjlouceng | congyenianxian | bankuai | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
cjshijian | |||||||||||||
2012-01-07 | 32 | 远洋山水中街店 | 180.0 | 店经理 | 99% 122 | 2.54 | 远洋山水 1室1厅 70平 | 卢德强 | 28 | 房东信赖;销售达人;带看活跃;海外顾问 | 西/中楼层/26层 | 5年以上 | 鲁谷 |
2012-01-07 | 32 | 远洋山水中街店 | 180.0 | 店经理 | 99% 122 | 2.54 | 远洋山水 1室1厅 70平 | 卢德强 | 28 | 房东信赖;销售达人;带看活跃;海外顾问 | 西/中楼层/26层 | 5年以上 | 鲁谷 |
2012-02-13 | 42 | 远洋山水中街店 | 235.0 | 店经理 | 95% 134 | 2.22 | 远洋山水 2室2厅 105平 | 乔璐璐 | 72 | 房东信赖;销售达人 | 南/中楼层/24层 | 5年以上 | 鲁谷 |
data = data.assign(time = (data.index - pd.to_datetime('2012-01-01')).days)
复制代码
data = data[['time', 'cjdanjia']]
复制代码
data.head(5)
复制代码
time | cjdanjia | |
---|---|---|
cjshijian | ||
2012-01-07 | 6 | 2.54 |
2012-01-07 | 6 | 2.54 |
2012-02-13 | 43 | 2.22 |
2012-02-15 | 45 | 2.06 |
2012-02-19 | 49 | 2.23 |
plt.scatter(data.time, data.cjdanjia)
复制代码
<matplotlib.collections.PathCollection at 0x119fcb7f0>
复制代码
X = data.time
Y = data.cjdanjia
复制代码
from sklearn.linear_model import LinearRegression
复制代码
model = LinearRegression() model.fit(pd.DataFrame(X), Y)
model = LinearRegression()
model.fit(pd.DataFrame(X), Y)
复制代码
LinearRegression(copy_X=True, fit_intercept=True, n_jobs=1, normalize=False)
复制代码
x = [[0], [1800]]
y = model.predict(pd.DataFrame(x))
plt.figure(figsize = (10, 8))
plt.plot(x, y)
plt.scatter(data.time, data.cjdanjia)
复制代码
<matplotlib.collections.PathCollection at 0x12068e400>
复制代码
model2 = LinearRegression()
model2.fit(pd.DataFrame({'x2': X*X, 'x1':X}), Y)
复制代码
LinearRegression(copy_X=True, fit_intercept=True, n_jobs=1, normalize=False)
复制代码
x = np.linspace(0, 1800)
y = model2.predict(pd.DataFrame({'x2': x*x, 'x1':x}))
plt.figure(figsize=(10,8))
plt.plot(x,y,color='r')
plt.scatter(data.time, data.cjdanjia)
复制代码
<matplotlib.collections.PathCollection at 0x10f357198>
复制代码
from sklearn.preprocessing import PolynomialFeatures
复制代码
q3 = PolynomialFeatures(degree=3)
复制代码
X3 = q3.fit_transform(pd.DataFrame(X))
复制代码
model3 = LinearRegression()
model3.fit(X3, Y)
复制代码
LinearRegression(copy_X=True, fit_intercept=True, n_jobs=1, normalize=False)
复制代码
x = np.linspace(0, 1800)
x_ = q3.fit_transform(pd.DataFrame(x))
y = model3.predict(x_)
plt.figure(figsize=(10,8))
plt.plot(x,y,color='r')
plt.scatter(data.time, data.cjdanjia)
复制代码
<matplotlib.collections.PathCollection at 0x11002f860>
复制代码
机器学习 房产价格预测相关推荐
- 【Kaggle】 Russia房产价格预测top1%(22/3270)方案总结
一起加入这次沉浸式学习吧,本次分享的方案基本上包好了结构化数据比赛的基本流程:数据分析.数据预处理,特征工程.模型训练以及模型融合,大家可以留在周末学习一波. 比赛名称:Sberbank Russia ...
- 机器学习对价格预测做模型与应用
说到价格预测,我们首先能想到的就是kaggle一个比赛,关于房价的预测,不过在房地产行业这么火热的时代,做一个中国版的房价预测也很有意思,但是博主想做的是一个对二手设备价格的预测,通过对二手设备的类型 ...
- Python二手车价格预测(二)—— 模型训练及可视化
系列文章目录 一.Python数据分析-二手车数据获取用于机器学习二手车价格预测 二.Python二手车价格预测(一)-- 数据处理 文章目录 系列文章目录 前言 一.明确任务 二.模型训练 1.引入 ...
- Python二手车价格预测(一)—— 数据处理
文章目录 前言 一.数据 二.处理过程 1.引入库 2.读入数据 3.删除无效列与填充空值 4.数值型数据处理 5.日期型数据处理 6.二值型数据处理 7.One-Hot型数据处理 结语 前言 一年半 ...
- 满帮如何将机器学习应用于车货匹配和公路干线价格预测?
http://www.infoq.com/cn/articles/ml-dl-highway-price 物流的战火,从来都是"非传统"的竞争者从"非传统"的角 ...
- 使用机器学习预测天气_使用机器学习的二手车价格预测
使用机器学习预测天气 You can reach all Python scripts relative to this on my GitHub page. If you are intereste ...
- 机器学习项目实战(五) 住房价格预测
机器学习项目实战系列 住房价格预测 目录 机器学习项目实战系列 住房价格预测 一.概述 二.分析数据 1.数据导入 2.基础统计运算 3.特征观察 4.建立模型 5.分析模型表现 (1)学习曲 ...
- 【计算机专业毕设之基于机器学习的大葱价格预测可视化分析-哔哩哔哩】 https://b23.tv/GLkWcjb
[计算机专业毕设之基于机器学习的大葱价格预测可视化分析-哔哩哔哩] https://b23.tv/GLkWcjb https://b23.tv/GLkWcjb
- 基于机器学习的二手车价格预测及应用实现(预测系统实现)
1.摘要 随着中国汽车工业的迅速发展,国内的汽车数量也在迅速增长.新车销售市场已经逐渐饱和,而二手车交易市场正在兴起.但是,由于中国的二手车市场尚未成熟,与发达国家相比仍存在较大差距.其中一个重要原因 ...
最新文章
- BZOJ 3514 Codechef MARCH14 GERALD07加强版
- Java左上到右下,java – 如何从上到下然后从左到右填充Gri...
- java面试spring_针对Java程序员的二十大Spring REST面试问题答案
- 数据库基础知识——存储过程和函数
- gels imagej 图片处理_如何用ImageJ进行粒度分析
- Docker学习与总结
- _id随机的 es_es 的数据操作
- weiit-saas搭建部署教程
- unity安装2020或2019出现空白错误
- matlab GUI界面变量值传递到其他.m文件
- 网路连接配置和DNS服务?解决无线网卡连接WIFI问题(硬件和驱动没问题)?
- 人脸识别访客系统解决方案
- SQL自动审核工具archer
- HIT-哈工大数据结构-作业3(C++)
- Android 客户端与服务器端时间校准
- 中华女子学院计算机考试题库,中华女子学院综合素质测试面试题历年总结
- adb安装应用失败,错误码整理
- 卡片消除游戏 java版(代码+讲解)
- 高等工程热力学复习04
- 【现代机器人学】学习笔记七:开链动力学(前向动力学Forward dynamics 与逆动力学Inverse dynamics)