用R语言看武汉市武昌区房租出租情况

从基础入门开始学了2个月的R语言,想试一试怎么用R语言进行分析,先简单画几个图,尝试一下,不对的请指正。
目的
了解武昌区目前房屋出租情况,以及房租价格问题分解:
1.了解不同户型,房屋的供给情况
2.了解不同区域,房屋的供给情况
3.了解不同朝向,房屋的供给情况
4.了解不同租金,房屋的供给情况

数据集的定义

获取数据来源:房天下
数据范围:武汉市武昌区房屋出租信息
数据集:武汉市武昌区房屋出租信息(采集样本量:2726)
工具:八爪鱼爬虫软件
时间:所有数据截止2018年10月31日

数据处理
步骤1:加载原始数据

#readxl包的read_excel函数
library(readxl)
#数据加载
fang<-read_excel("fangtx_chuzu.xlsx",1)
fang<-fang[,c('name','type','acreage','direction','rent','area')]
#观察数据,分类变量不是因子结构,且存在不需要的字符
str(fang)


步骤2:识别缺失值

#构建新的数据,观察数据
fangtx<-fang[complete.cases(fang),]
aggr(fangtx,prop=T,numbers=T)


步骤3:数据清洗

cleaning <- function(x){#删除重复行x<-x[!duplicated(x[c("name","type","area")]),]#清理字符串中的不需要的字符#将需要分析的字符变量转化为因子,并对部分因子重新编码x$rent<-as.numeric(sub("元/月","",x$rent))x$rent<-x$rent/100x$acreage<-as.numeric(sub("㎡","",x$acreage))x$direction<-factor(x$direction,levels = c("朝东","朝西","朝南","朝北"))x$area<-factor(x$area,levels = c("东湖东亭","积玉桥","南湖花园","水果湖","司门口","武泰闸烽火","小东门"))x$type[x$type %in% c("1室0厅","1室2厅")]<-"1室1厅"x$type[x$type %in% c("2室0厅","2室1厅","2户合租")]<-"2室2厅"x$type[x$type %in% c("3室0厅","3室1厅","3室3厅","3户合租")]<-"3室2厅"x$type[x$type %in% c("4室0厅","4室1厅","4室2厅","4室5厅","4户合租")]<-"4室3厅"x$type[x$type %in% c("5室0厅","5室1厅","5室2厅","5室3厅","5户合租","6室2厅","6室3厅","7室2厅","7室3厅","8室3厅","9室9厅")]<-"别墅"x$type<-factor(x$type,levels = c("1室1厅","2室2厅","3室2厅","4室3厅","别墅"))return(x)
}
fangtx.cleaning<-cleaning(fangtx)
str(fangtx.cleaning)

数据基本清理干净
#创建ggplot绘图对象

p1<-ggplot(fangtx.cleaning,aes(x=type))+geom_bar(fill="lightblue",colour="white")+labs(x="户型",y="不同户型供应量",title="哪种户型较多")
p2<-ggplot(fangtx.cleaning,aes(x=area))+geom_bar(fill="lightblue",colour="white")+labs(x="区域",y="不同区域供应量",title="哪片区域较多")
p3<-ggplot(fangtx.cleaning,aes(x=direction))+geom_bar(fill="lightblue",colour="white")+labs(x="朝向",y="不同朝向房屋供应量",title="哪种朝向供应量较多")
p4<-ggplot(fangtx.cleaning,aes(x=rent,y=..density..))+geom_histogram(bins=50,fill="lightblue",colour="white")+stat_density(geom = "line",position = "identity",aes(x=rent),colour="brown1")+labs(x="租金",title="月租金分布")

从供应量来看2室2厅的房屋供应量比较大


从供应量来看南湖花园、东湖东亭的供应量比较大


从供应量方面来看,主要供应朝南的房屋,也从侧面说明,朝南的房屋更容易出租一下

从租金方面来看,租金在2000~3000元内的房屋供应量较大
该数据不作为任何商业用途。

用R语言看武汉市武昌区房租出租情况相关推荐

  1. r语言 整理、处理数据步骤_R语言之数据处理(一)

    在上一篇小文中,提到了关于R语言导入数据的一些方法,之后的重点就转向了数据的处理上.数据处理其实在整个数据分析项目中所占用的时间是比较多的,所以根据处理的目的不同,也有不同的处理方法.在R语言中,我通 ...

  2. r语言中正定矩阵由于误差不正定_R语言之数据处理(一)

    在上一篇小文中,提到了关于R语言导入数据的一些方法,之后的重点就转向了数据的处理上.数据处理其实在整个数据分析项目中所占用的时间是比较多的,所以根据处理的目的不同,也有不同的处理方法.在R语言中,我通 ...

  3. R语言ggplot2可视化:可视化多个图像并组合起来(如果没有对齐,看着丑陋))、保证组合的图像图像区域对齐或者图像整体对齐(Align plot areas in ggplot)

    R语言ggplot2可视化:可视化多个图像并组合起来(如果没有对齐,看着丑陋)).保证组合的图像图像区域对齐或者图像整体对齐(Align plot areas in ggplot) 目录

  4. r语言electricity数据集_R语言学习10-查看数据

    当我们处理一个新的数据集的时候,第一件事就是要对数据做一个了解.数据的格式是什么?数据的维度是多少?变量名是什么? 变量如何存储? 是否缺少数据? 数据中是否有任何缺陷? 本次课将学习如何使用R的内置 ...

  5. 方差分析中怎么看有无显著性影响_用R语言做单因素方差分析及多重比较

    SPSS方差分析的应用已经做得非常好了,绝大多数的方差分析问题均可通过SPSS"点菜单"的方式得以解决,R语言在统计和可视化方面有自己的特色,我们不妨来对比着学习.选用R语言自带案 ...

  6. r语言adf检验结果怎么看_从AR模型到VAR模型——R语言实现

    一.自回归模型(AR模型) 1.1 概念 自回归模型(英语:Autoregressive model,简称AR模型),是统计上一种处理时间序列的方法,用同一变量例如的之前各期,亦即至来预测本期的表现, ...

  7. 看书标记【R语言 商务数据分析实战4】

    看书标记--关于R语言 chapter 4 4.2 任务实现 [R语言 商务数据分析实战4] chapter 4 财政收入预测分析 从海量数据中发现隐藏的运行模式,并提供具有决策意义的信息.变量过多会 ...

  8. 看书标记【R语言 商务数据分析实战5】

    看书标记--关于R语言 chapter 5 5.2 任务实现 [R语言 商务数据分析实战5] chapter 5 金融服务机构资金流量预测 数据理解和预处理>>检验平稳性+纯随机性> ...

  9. r语言alasso的系数怎么看_R语言如何做COX回归分析和nomogram?

    准备用几次推送与大家一起系统的学习下Nomogrm的绘制原理及其在R软件和SAS软件中的实现.首先声明,文章只是自己文献上的整理及自己的一点点理解,错误之处还请大家指出! 在wikipedia 里对N ...

  10. 看书标记【R语言 商务数据分析实战6】

    看书标记--关于R语言 chapter 6 6.2 任务实 [R语言 商务数据分析实战6] chapter 6 P2P信用贷款风险控制(用户逾期还款概率模型) 关于数据库的应用+数据清洗+实时数据识别 ...

最新文章

  1. DataNumen RAR Repair中文版
  2. java 消息队列_java消息队列
  3. 关于android的4.2的0文件夹的详解
  4. hive load data外部表报错_生产SparkSQL如何读写本地外部数据源及排错
  5. 炸了!亚马逊薪资文件泄露!原来这么多人年薪百万
  6. 通过SQL Server 2008数据库复制实现数据库同步备份
  7. Leetcode207---课程表(逆拓扑排序)
  8. Atitit 图像处理之仿油画效果 Oilpaint油画滤镜 水彩画 漫画滤镜 v2
  9. python按字节读文件-使用Python进行二进制文件读写(转)
  10. eclipse中文版界面设置黑色_Eclipse设置黑色主题
  11. java jsp使用flash播放mp4,jsp页面添加视频播放
  12. 基于深度卷积神经网络的图像超分辨率重建(SRCNN) 学习笔记
  13. Swift获取当前网络状态Wifi/5G/4G/3G/2G
  14. 考研计算机考点精讲课程笔记新东方,新东方词汇笔记非常完整版
  15. 在线问答系统html模板,问答系统网站模板
  16. 残差网络(Residual Network)
  17. 钱多多软件制作第七天
  18. Python 第三方模块 统计1 statsmodels模块1 简介,回归
  19. cml sml区别_【金融常识】SML和CML的区别与联系
  20. truetype字体怎么转换成普通字体_字体 – 如何将位图字体(.FON)转换为truetype字体(.TTF)?...

热门文章

  1. Python网络爬虫与信息提取学习
  2. 【牛客网-公司真题-前端入门篇】——2021牛客模考-卷1
  3. 2022保研夏令营/预推免记录:浙大计院直博/西湖电子直博/南大软院/厦大信院
  4. Win 7 配置FTP权限
  5. HTB-Unified
  6. SuperMap根据栅格数据制作专题图
  7. WORD出现VBE6EXT.OLD不能被加载的问题
  8. UniApp 获取屏幕分辨率
  9. 可恶的零宽空格—ZWSP
  10. 看过的最好的护肤心得 续.