github地址 : github.com/yangjinghit…

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline
复制代码
data1 = pd.read_csv('lianjia1.csv', encoding='gbk')
data2 = pd.read_csv('lianjia2.csv', encoding='gbk')
data3 = pd.read_csv('lianjia3.csv', encoding='utf-8')
data4 = pd.read_csv('lianjia4.csv', encoding='utf-8')
data5 = pd.read_csv('lianjia5.csv', encoding='utf-8')
data6 = pd.read_csv('lianjia6.csv', encoding='utf-8')
data7 = pd.read_csv('lianjia7.csv', encoding='utf-8')
复制代码
data = pd.concat([data1, data2, data3, data4, data5,data6,data7])
复制代码
len(data)
复制代码
162227
复制代码
data = data.dropna()
复制代码
len(data)
复制代码
144531
复制代码
data.cjdanjia = np.round(data.cjdanjia.str.replace('元/平','').astype(np.float32).map(lambda x: x/10000), 2)
复制代码
data.cjshijian = pd.to_datetime(data.cjshijian.map(lambda x :x[5:]))
复制代码
data = data[data.cjxiaoqu.str.contains('远洋山水')]
复制代码
data = data.sort_values(by='cjshijian')
复制代码
data.set_index('cjshijian', inplace=True)
复制代码
data = data['2012':]
复制代码
#data.set_index('cjshijian',inplace=True)['2012':]
复制代码
data = data[data.cjdanjia > 1]
复制代码
data.head(3)
复制代码
cjtaoshu mendian cjzongjia zhiwei haoping cjdanjia cjxiaoqu xingming cjzhouqi biaoqian cjlouceng congyenianxian bankuai
cjshijian
2012-01-07 32 远洋山水中街店 180.0 店经理 99% 122 2.54 远洋山水 1室1厅 70平 卢德强 28 房东信赖;销售达人;带看活跃;海外顾问 西/中楼层/26层 5年以上 鲁谷
2012-01-07 32 远洋山水中街店 180.0 店经理 99% 122 2.54 远洋山水 1室1厅 70平 卢德强 28 房东信赖;销售达人;带看活跃;海外顾问 西/中楼层/26层 5年以上 鲁谷
2012-02-13 42 远洋山水中街店 235.0 店经理 95% 134 2.22 远洋山水 2室2厅 105平 乔璐璐 72 房东信赖;销售达人 南/中楼层/24层 5年以上 鲁谷
data = data.assign(time = (data.index - pd.to_datetime('2012-01-01')).days)
复制代码
data = data[['time', 'cjdanjia']]
复制代码
data.head(5)
复制代码
time cjdanjia
cjshijian
2012-01-07 6 2.54
2012-01-07 6 2.54
2012-02-13 43 2.22
2012-02-15 45 2.06
2012-02-19 49 2.23
plt.scatter(data.time, data.cjdanjia)
复制代码
<matplotlib.collections.PathCollection at 0x119fcb7f0>
复制代码
X = data.time
Y = data.cjdanjia
复制代码
from sklearn.linear_model import LinearRegression
复制代码

model = LinearRegression() model.fit(pd.DataFrame(X), Y)

model = LinearRegression()
model.fit(pd.DataFrame(X), Y)
复制代码
LinearRegression(copy_X=True, fit_intercept=True, n_jobs=1, normalize=False)
复制代码
x = [[0], [1800]]
y = model.predict(pd.DataFrame(x))
plt.figure(figsize = (10, 8))
plt.plot(x, y)
plt.scatter(data.time, data.cjdanjia)
复制代码
<matplotlib.collections.PathCollection at 0x12068e400>
复制代码
model2 = LinearRegression()
model2.fit(pd.DataFrame({'x2': X*X, 'x1':X}), Y)
复制代码
LinearRegression(copy_X=True, fit_intercept=True, n_jobs=1, normalize=False)
复制代码
x = np.linspace(0, 1800)
y = model2.predict(pd.DataFrame({'x2': x*x, 'x1':x}))
plt.figure(figsize=(10,8))
plt.plot(x,y,color='r')
plt.scatter(data.time, data.cjdanjia)
复制代码
<matplotlib.collections.PathCollection at 0x10f357198>
复制代码
from sklearn.preprocessing import PolynomialFeatures
复制代码
q3 = PolynomialFeatures(degree=3)
复制代码
X3 = q3.fit_transform(pd.DataFrame(X))
复制代码
model3 = LinearRegression()
model3.fit(X3, Y)
复制代码
LinearRegression(copy_X=True, fit_intercept=True, n_jobs=1, normalize=False)
复制代码
x = np.linspace(0, 1800)
x_ = q3.fit_transform(pd.DataFrame(x))
y = model3.predict(x_)
plt.figure(figsize=(10,8))
plt.plot(x,y,color='r')
plt.scatter(data.time, data.cjdanjia)
复制代码
<matplotlib.collections.PathCollection at 0x11002f860>
复制代码

机器学习 房产价格预测相关推荐

  1. 【Kaggle】 Russia房产价格预测top1%(22/3270)方案总结

    一起加入这次沉浸式学习吧,本次分享的方案基本上包好了结构化数据比赛的基本流程:数据分析.数据预处理,特征工程.模型训练以及模型融合,大家可以留在周末学习一波. 比赛名称:Sberbank Russia ...

  2. 机器学习对价格预测做模型与应用

    说到价格预测,我们首先能想到的就是kaggle一个比赛,关于房价的预测,不过在房地产行业这么火热的时代,做一个中国版的房价预测也很有意思,但是博主想做的是一个对二手设备价格的预测,通过对二手设备的类型 ...

  3. Python二手车价格预测(二)—— 模型训练及可视化

    系列文章目录 一.Python数据分析-二手车数据获取用于机器学习二手车价格预测 二.Python二手车价格预测(一)-- 数据处理 文章目录 系列文章目录 前言 一.明确任务 二.模型训练 1.引入 ...

  4. Python二手车价格预测(一)—— 数据处理

    文章目录 前言 一.数据 二.处理过程 1.引入库 2.读入数据 3.删除无效列与填充空值 4.数值型数据处理 5.日期型数据处理 6.二值型数据处理 7.One-Hot型数据处理 结语 前言 一年半 ...

  5. 满帮如何将机器学习应用于车货匹配和公路干线价格预测?

    http://www.infoq.com/cn/articles/ml-dl-highway-price 物流的战火,从来都是"非传统"的竞争者从"非传统"的角 ...

  6. 使用机器学习预测天气_使用机器学习的二手车价格预测

    使用机器学习预测天气 You can reach all Python scripts relative to this on my GitHub page. If you are intereste ...

  7. 机器学习项目实战(五) 住房价格预测

    机器学习项目实战系列   住房价格预测 目录 机器学习项目实战系列   住房价格预测 一.概述 二.分析数据 1.数据导入 2.基础统计运算 3.特征观察 4.建立模型 5.分析模型表现 (1)学习曲 ...

  8. 【计算机专业毕设之基于机器学习的大葱价格预测可视化分析-哔哩哔哩】 https://b23.tv/GLkWcjb

    [计算机专业毕设之基于机器学习的大葱价格预测可视化分析-哔哩哔哩] https://b23.tv/GLkWcjb https://b23.tv/GLkWcjb

  9. 基于机器学习的二手车价格预测及应用实现(预测系统实现)

    1.摘要 随着中国汽车工业的迅速发展,国内的汽车数量也在迅速增长.新车销售市场已经逐渐饱和,而二手车交易市场正在兴起.但是,由于中国的二手车市场尚未成熟,与发达国家相比仍存在较大差距.其中一个重要原因 ...

最新文章

  1. BZOJ 3514 Codechef MARCH14 GERALD07加强版
  2. Java左上到右下,java – 如何从上到下然后从左到右填充Gri...
  3. java面试spring_针对Java程序员的二十大Spring REST面试问题答案
  4. 数据库基础知识——存储过程和函数
  5. gels imagej 图片处理_如何用ImageJ进行粒度分析
  6. Docker学习与总结
  7. _id随机的 es_es 的数据操作
  8. weiit-saas搭建部署教程
  9. unity安装2020或2019出现空白错误
  10. matlab GUI界面变量值传递到其他.m文件
  11. 网路连接配置和DNS服务?解决无线网卡连接WIFI问题(硬件和驱动没问题)?
  12. 人脸识别访客系统解决方案
  13. SQL自动审核工具archer
  14. HIT-哈工大数据结构-作业3(C++)
  15. Android 客户端与服务器端时间校准
  16. 中华女子学院计算机考试题库,中华女子学院综合素质测试面试题历年总结
  17. adb安装应用失败,错误码整理
  18. 卡片消除游戏 java版(代码+讲解)
  19. 高等工程热力学复习04
  20. 【现代机器人学】学习笔记七:开链动力学(前向动力学Forward dynamics 与逆动力学Inverse dynamics)

热门文章

  1. 苹果WWDC 2021新产品预测
  2. React Router缓存路由
  3. linux 内核uevent事件,Linux的uevent事件机制
  4. PIC单片机入门_定时器TMR2详解与实例
  5. 2023-JavaSE最新整理面试题-面向对象异常集合专题
  6. Vue移动端UI组件库
  7. 数据爬取 js 分析(二):对加密参数进行 js分析
  8. 如何在iPhone5上更换铃声
  9. 根据首期还款日和分期数两个参数计算每期还款日期
  10. 机器学习-3.数据特征预处理与数据降维