用R语言看武汉市武昌区房租出租情况
用R语言看武汉市武昌区房租出租情况
从基础入门开始学了2个月的R语言,想试一试怎么用R语言进行分析,先简单画几个图,尝试一下,不对的请指正。
目的
了解武昌区目前房屋出租情况,以及房租价格问题分解:
1.了解不同户型,房屋的供给情况
2.了解不同区域,房屋的供给情况
3.了解不同朝向,房屋的供给情况
4.了解不同租金,房屋的供给情况
数据集的定义
获取数据来源:房天下
数据范围:武汉市武昌区房屋出租信息
数据集:武汉市武昌区房屋出租信息(采集样本量:2726)
工具:八爪鱼爬虫软件
时间:所有数据截止2018年10月31日
数据处理
步骤1:加载原始数据
#readxl包的read_excel函数
library(readxl)
#数据加载
fang<-read_excel("fangtx_chuzu.xlsx",1)
fang<-fang[,c('name','type','acreage','direction','rent','area')]
#观察数据,分类变量不是因子结构,且存在不需要的字符
str(fang)
步骤2:识别缺失值
#构建新的数据,观察数据
fangtx<-fang[complete.cases(fang),]
aggr(fangtx,prop=T,numbers=T)
步骤3:数据清洗
cleaning <- function(x){#删除重复行x<-x[!duplicated(x[c("name","type","area")]),]#清理字符串中的不需要的字符#将需要分析的字符变量转化为因子,并对部分因子重新编码x$rent<-as.numeric(sub("元/月","",x$rent))x$rent<-x$rent/100x$acreage<-as.numeric(sub("㎡","",x$acreage))x$direction<-factor(x$direction,levels = c("朝东","朝西","朝南","朝北"))x$area<-factor(x$area,levels = c("东湖东亭","积玉桥","南湖花园","水果湖","司门口","武泰闸烽火","小东门"))x$type[x$type %in% c("1室0厅","1室2厅")]<-"1室1厅"x$type[x$type %in% c("2室0厅","2室1厅","2户合租")]<-"2室2厅"x$type[x$type %in% c("3室0厅","3室1厅","3室3厅","3户合租")]<-"3室2厅"x$type[x$type %in% c("4室0厅","4室1厅","4室2厅","4室5厅","4户合租")]<-"4室3厅"x$type[x$type %in% c("5室0厅","5室1厅","5室2厅","5室3厅","5户合租","6室2厅","6室3厅","7室2厅","7室3厅","8室3厅","9室9厅")]<-"别墅"x$type<-factor(x$type,levels = c("1室1厅","2室2厅","3室2厅","4室3厅","别墅"))return(x)
}
fangtx.cleaning<-cleaning(fangtx)
str(fangtx.cleaning)
数据基本清理干净
#创建ggplot绘图对象
p1<-ggplot(fangtx.cleaning,aes(x=type))+geom_bar(fill="lightblue",colour="white")+labs(x="户型",y="不同户型供应量",title="哪种户型较多")
p2<-ggplot(fangtx.cleaning,aes(x=area))+geom_bar(fill="lightblue",colour="white")+labs(x="区域",y="不同区域供应量",title="哪片区域较多")
p3<-ggplot(fangtx.cleaning,aes(x=direction))+geom_bar(fill="lightblue",colour="white")+labs(x="朝向",y="不同朝向房屋供应量",title="哪种朝向供应量较多")
p4<-ggplot(fangtx.cleaning,aes(x=rent,y=..density..))+geom_histogram(bins=50,fill="lightblue",colour="white")+stat_density(geom = "line",position = "identity",aes(x=rent),colour="brown1")+labs(x="租金",title="月租金分布")
从供应量来看2室2厅的房屋供应量比较大
从供应量来看南湖花园、东湖东亭的供应量比较大
从供应量方面来看,主要供应朝南的房屋,也从侧面说明,朝南的房屋更容易出租一下
从租金方面来看,租金在2000~3000元内的房屋供应量较大
该数据不作为任何商业用途。
用R语言看武汉市武昌区房租出租情况相关推荐
- r语言 整理、处理数据步骤_R语言之数据处理(一)
在上一篇小文中,提到了关于R语言导入数据的一些方法,之后的重点就转向了数据的处理上.数据处理其实在整个数据分析项目中所占用的时间是比较多的,所以根据处理的目的不同,也有不同的处理方法.在R语言中,我通 ...
- r语言中正定矩阵由于误差不正定_R语言之数据处理(一)
在上一篇小文中,提到了关于R语言导入数据的一些方法,之后的重点就转向了数据的处理上.数据处理其实在整个数据分析项目中所占用的时间是比较多的,所以根据处理的目的不同,也有不同的处理方法.在R语言中,我通 ...
- R语言ggplot2可视化:可视化多个图像并组合起来(如果没有对齐,看着丑陋))、保证组合的图像图像区域对齐或者图像整体对齐(Align plot areas in ggplot)
R语言ggplot2可视化:可视化多个图像并组合起来(如果没有对齐,看着丑陋)).保证组合的图像图像区域对齐或者图像整体对齐(Align plot areas in ggplot) 目录
- r语言electricity数据集_R语言学习10-查看数据
当我们处理一个新的数据集的时候,第一件事就是要对数据做一个了解.数据的格式是什么?数据的维度是多少?变量名是什么? 变量如何存储? 是否缺少数据? 数据中是否有任何缺陷? 本次课将学习如何使用R的内置 ...
- 方差分析中怎么看有无显著性影响_用R语言做单因素方差分析及多重比较
SPSS方差分析的应用已经做得非常好了,绝大多数的方差分析问题均可通过SPSS"点菜单"的方式得以解决,R语言在统计和可视化方面有自己的特色,我们不妨来对比着学习.选用R语言自带案 ...
- r语言adf检验结果怎么看_从AR模型到VAR模型——R语言实现
一.自回归模型(AR模型) 1.1 概念 自回归模型(英语:Autoregressive model,简称AR模型),是统计上一种处理时间序列的方法,用同一变量例如的之前各期,亦即至来预测本期的表现, ...
- 看书标记【R语言 商务数据分析实战4】
看书标记--关于R语言 chapter 4 4.2 任务实现 [R语言 商务数据分析实战4] chapter 4 财政收入预测分析 从海量数据中发现隐藏的运行模式,并提供具有决策意义的信息.变量过多会 ...
- 看书标记【R语言 商务数据分析实战5】
看书标记--关于R语言 chapter 5 5.2 任务实现 [R语言 商务数据分析实战5] chapter 5 金融服务机构资金流量预测 数据理解和预处理>>检验平稳性+纯随机性> ...
- r语言alasso的系数怎么看_R语言如何做COX回归分析和nomogram?
准备用几次推送与大家一起系统的学习下Nomogrm的绘制原理及其在R软件和SAS软件中的实现.首先声明,文章只是自己文献上的整理及自己的一点点理解,错误之处还请大家指出! 在wikipedia 里对N ...
- 看书标记【R语言 商务数据分析实战6】
看书标记--关于R语言 chapter 6 6.2 任务实 [R语言 商务数据分析实战6] chapter 6 P2P信用贷款风险控制(用户逾期还款概率模型) 关于数据库的应用+数据清洗+实时数据识别 ...
最新文章
- DataNumen RAR Repair中文版
- java 消息队列_java消息队列
- 关于android的4.2的0文件夹的详解
- hive load data外部表报错_生产SparkSQL如何读写本地外部数据源及排错
- 炸了!亚马逊薪资文件泄露!原来这么多人年薪百万
- 通过SQL Server 2008数据库复制实现数据库同步备份
- Leetcode207---课程表(逆拓扑排序)
- Atitit 图像处理之仿油画效果 Oilpaint油画滤镜 水彩画 漫画滤镜 v2
- python按字节读文件-使用Python进行二进制文件读写(转)
- eclipse中文版界面设置黑色_Eclipse设置黑色主题
- java jsp使用flash播放mp4,jsp页面添加视频播放
- 基于深度卷积神经网络的图像超分辨率重建(SRCNN) 学习笔记
- Swift获取当前网络状态Wifi/5G/4G/3G/2G
- 考研计算机考点精讲课程笔记新东方,新东方词汇笔记非常完整版
- 在线问答系统html模板,问答系统网站模板
- 残差网络(Residual Network)
- 钱多多软件制作第七天
- Python 第三方模块 统计1 statsmodels模块1 简介,回归
- cml sml区别_【金融常识】SML和CML的区别与联系
- truetype字体怎么转换成普通字体_字体 – 如何将位图字体(.FON)转换为truetype字体(.TTF)?...