最近在自学R语言,但是从纯粹的理论开始学习太慢了而且没有实操不太行,所以目前是在实际应用中查漏补缺,遇到什么临时学什么,然后把笔记都一一记录下啦。分享出来一边是方便自己查找,另一方面也是想方便和我一样入门的菜鸟哈哈哈,这个系列将持续更新哦。其中有些图表来源于网络,如有侵权联系可删 ~


目录

一、R语言介绍

二、快捷键

二、R语言包的学习

(一)ggplot2

1、数据

2、函数

三、知识点合集

(一)回归的种类



一、R语言介绍

  1. R语言对大小写比较敏感,命名可以数字、字母和  .   以及  _   开头,但是如果以  .  开头,那么后面不可以接数字。
  2. 基本命令要么是表达式要么就是赋值。
  3. 命令可以被  ;  隔开,也可以直接跳到下一行。
  4. 基本命令可以通过大括弧{ }构成一个复合表达式。
  5. R的基本数据类型包括数值型(numeric)、字符型(character)、复数型(complex)、逻辑型(logical);对象类型有向量、因子、数组、矩阵、数据框、列表、时间序列。

二、快捷键

  1. 退出R程序:q()
  2. 自动补全:tab
  3. 清空console:ctrl+L
  4. 中断当前计算:ESC
  5. 执行代码: Ctrl+Enter 或者Run
  6. 查找:Ctrl+F
  7. 保存:Ctrl+S
  8. 撤销:Ctrl+Z
  9. 恢复:Ctrl+Y
  10. 删除整行:Ctrl+D
  11. 批量选择:alt
  12. 注释:Ctrl+Shift+C
  13. 更新:点击Update
  14. 查看某个包:help(package=“rpart”)
  15. 设置断点:browser(  )或debug(  )
  16. 加载R数据包:require(  )或library(  )
  17. 重新运行上一段代码: Ctrl + Shift + P
  18. 执行整个文件: Ctrl + Shift + Enter
  19. 获取工作路径:在Console中输入getwd( )
  20. 安装Package:点击Install输入包名,或者在Console中输入install.packages('  ')
  21. 中文注释换乱码:【Tools】→【Global Options...】→【Code】→【Saving】,选择UTF-8.
  22. R中常用的符号:
  23. R中常用的函数:


二、R语言包的学习

(一)ggplot2

一款图形可视化的R包,核心理念是将绘图与数据分离,按图层作图,其中图层包括三层——数据层、几何图形层和美学层,有利于结构化思维,同时保有命令式作图的调整函数,使其更具灵活性,绘制出来的图形美观,同时避免繁琐细节。包含以下几个概念,以下这些不同层之间都是使用“+”连接起来的,也就是最终是以图层的形式进行叠加展示。

  1. 数据(Data)和映射(Mapping):数据映到图像
  2. 标度(Scale):数据取值映射到图形空间,其中最主要的是图形属性(aesthetic attributes,记作aes),例如用:颜色、大小、形状表示不同取值
  3. 几何对象(Geometric Object,记作geom):统计图中看到的实际元素,比如点、线、多边形等
  4. 统计变换(Statistics Transformation,记作stats:对数据进行某种汇总,如直方图,或将二维关系用线性模型解释
  5.  坐标系统(Coordinate System,记作coord:指的是数据如何映射到图形所在平面,提供作图所需的坐标轴和网格线
  6. 图层(Layer):将数据分解为子集,进行联合展示
  7. 分面(Facet):对所需的绘图操作进行一层一层叠加,最终得到所需图形,将绘图窗口分成若干个子窗口。

1、数据

在使用ggplot2的过程中,接受的数据集必须是以data.frame格式的。

2、函数

(1)ggplot( ):找到映射的对应关系,data=(数据集),新手训练的时候可以使用ggplot2中自带的mpg数据集进行练习。

(2)aes( ):映射函数,分别使用 x =(x轴坐标内容)y =(y轴坐标内容)制定需要映射的变量。

(3)geom_point ( ):散点图绘制函数。

library(ggplot2)
ggplot(data=mpg,mapping=aes(x=cty,y=hwy))+geom_point()

这个地方的代码还可以拓展一下,函数的变化还是非常灵活的。

比如,按照年份这个变量变换颜色。

ggplot(data=mpg,mapping=aes(x=cty,y=hwy,color=factor(year)))+geom_point()

其实这里的"data=","x=","y="都可以省略,同时试着把factor省略。另外,这里的“color( )”放在ggplot( )中和geom_point( )中都是可以的,两个代码的图都是一样的哦。

ggplot(mpg,mapping=aes(cty,hwy,color=year))+geom_point()
ggplot(mpg,mapping=aes(cty,hwy))+geom_point(aes(color=year))

(4)geom_histogram( ):直方图绘制函数,针对连续变量。

library(ggplot2)
ggplot(data=mpg,mapping=aes(x=hwy))+geom_histogram()

(5)geom_bar( ):柱形图绘制函数,也称柱形图,针对离散变量。

(6)geom_density( ):密度图绘制函数。

(7)geom_box( ):箱线图绘制函数。

其他的一些几何对象变换可选。

(8)stat_smooth( ):拟合曲线。

ggplot(mpg,mapping=aes(cty,hwy,color=year))+geom_point()+stat_smooth()

其他的统计变换函数可选。

(9)facet_wrap( ):分面函数。

ggplot(mpg,mapping=aes(cty,hwy,color=year))+geom_point()+stat_smooth()+facet_warp(~year)

两张图在一行有点拥挤,可以指定行和列。其中,指定列使用ncol= ,指定行用nrow= 。

ggplot(mpg,mapping=aes(cty,hwy,color=year))+geom_point()+stat_smooth()+facet_wrap(~year,ncol=1)

(10)主题函数: labs( )、xlab()、ylab()、theme( )

ggplot(mpg,mapping=aes(cty,hwy,color=year))+geom_point()+stat_smooth()+facet_wrap(~year,ncol=1)+labs(x='每加仑城市公路行驶距离',y='每加仑高速公路行驶距离',title='汽车油耗与型号')

再来调整一下标题的位置和美观程度。

ggplot(mpg,mapping=aes(cty,hwy,color=year))+geom_point()+stat_smooth()+facet_wrap(~year,ncol=1)+labs(x='每加仑城市公路行驶距离',y='每加仑高速公路行驶距离',title='汽车油耗与型号')+theme(plot.title = element_text(hjust = 0.5))

ggplot(mpg,mapping=aes(cty,hwy,color=year))+geom_point()+stat_smooth()+facet_wrap(~year,ncol=1)+labs(x='每加仑城市公路行驶距离',y='每加仑高速公路行驶距离',title='汽车油耗与型号')+theme_bw()+theme(plot.title = element_text(hjust = 0.5),panel.grid = element_blank())

同时,ggplot2中提供很多可以直接使用的主题。比如theme_grey ()是默认主题,theme_bw( )是白色背景主题,theme_classic( )是经典主题。


三、知识点合集

(一)回归的种类

  1. 简单线性:一个量化的解释变量预测一个量化的响应变量(一个因变量、一个自变量)
  2. 多项式:一个量化的解释变量预测一个而量化的响应变量,模型关系是n阶多项式(一个预测变量,但同时包含变量的幂)
  3. 多元线性:两个或多个解释变量预测多个相应变量
  4. Logistic:一个或多个解释变量预测一个类别型变量
  5. 泊松:一个或多个解释变量预测一个代表频数的响应变量
  6. Cox比例风险:一个或多个解释变量预测一个事件发生的时间序列对误差项相关的时间序列数据建模
  7. 非线性:一个或多个量化的解释变量预测一个量化的响应变量,不过模型是非线性的
  8. 非参数:一个或多个量化的解释变量预测一个量化的响应变量,模型的形式源自数据形式,不事先设定
  9. 稳健:一个或多个量化的解释变量预测一个量化的响应变量,能抵御强影响点的干扰
  10. OLS回归:通过预测变量的加权和来预测量化的因变量,其中权重使通过数据估计而得以的参数,主要是使残差平方和最小。
  11. 用lm()拟合回归模型:格式是myfit <- lm(formula,data),formula指要拟合的模型形式,data是一个数据框,包含了用于拟合模型的数据,formula形式如下:Y~X1+X2+……+Xk (~左边为响应变量,右边为各个预测变量,预测变量之间用+符号分隔)。

R语言学习—— ggplot2函数相关推荐

  1. R语言使用ggplot2函数可视化需要构建泊松回归模型的计数目标变量的直方图分布并分析构建泊松回归模型的可行性

    R语言使用ggplot2函数可视化需要构建泊松回归模型的计数目标变量的直方图分布并分析构建泊松回归模型的可行性 目录

  2. R语言学习——plot函数

    plot函数是R语言中画图使用最多的函数,参数也非常之多,简单的总结,之后应该会在学习的过程中不断完善. plot(x, y = NULL ,type = "p", xlim = ...

  3. R语言使用ggplot2包使用geom_boxplot函数绘制基础分组箱图(配置数据点抖动显示jitter)实战

    R语言使用ggplot2包使用geom_boxplot函数绘制基础分组箱图(配置数据点抖动显示jitter)实战 目录 R语言使用ggplot2包使用geom_boxplot函数绘制基础分组箱图(配置 ...

  4. R语言使用ggplot2包使用geom_density()函数绘制密度图(连续色彩、离散色彩、梯度色彩)实战(density plot)

    R语言使用ggplot2包使用geom_density()函数绘制密度图(连续色彩.离散色彩.梯度色彩)实战(density plot) 目录 R语言使用ggplot2包使用geom_density( ...

  5. R语言使用ggplot2包使用geom_boxplot函数绘制基础分组箱图(分组箱体框颜色自定义配置)实战

    R语言使用ggplot2包使用geom_boxplot函数绘制基础分组箱图(分组箱体框颜色自定义配置)实战 目录 R语言使用ggplot2包使用geom_boxplot函数绘制基础分组箱图(分组箱体框 ...

  6. R语言使用ggplot2包使用geom_boxplot函数绘制基础分组箱图(添加均值点)实战

    R语言使用ggplot2包使用geom_boxplot函数绘制基础分组箱图(添加均值点)实战 目录 R语言使用ggplot2包使用geom_boxplot函数绘制基础分组箱图(添加均值点)实战

  7. R语言使用ggplot2包的快速可视化函数qplot绘制基础密度图实战

    R语言使用ggplot2包的快速可视化函数qplot绘制基础密度图实战 目录 R语言使用ggplot2包的快速可视化函数qplot绘制基础密度图实战 #仿真数据

  8. R语言使用ggplot2包的快速可视化函数qplot绘制分组点图(带状图)并配置分组颜色实战

    R语言使用ggplot2包的快速可视化函数qplot绘制分组点图(带状图)并配置分组颜色实战 目录 R语言使用ggplot2包的快速可视化函数qplot绘制分组点图(带状图)并配置分组颜色实战 #仿真 ...

  9. R语言使用ggplot2包使用geom_boxplot函数绘制基础分组箱图(主题模式配置、色彩设置)实战

    R语言使用ggplot2包使用geom_boxplot函数绘制基础分组箱图(主题模式配置.色彩设置)实战 目录 R语言使用ggplot2包使用geom_boxplot函数绘制基础分组箱图(分组箱体框颜 ...

最新文章

  1. HTML4 和 HTML5 的10个关键区别
  2. 【算法笔记】一步一步推出来的同余最短路优化思路(千字长文,超详细)
  3. 关于Docker目录挂载的总结(转)
  4. “火震”太多打乱NASA计划,火星探测计划将推迟到2022年底
  5. 【目录】C#操作Excel组件Spire.XLS系列文章目录
  6. 海龟绘图画花朵_我家宝宝最喜欢的一本图画书——我的连衣裙
  7. boost::mpl::aux::largest_int相关用法的测试程序
  8. webstorm最新破解方法
  9. 11个JavaScript颜色选择器插件
  10. k-means均值向量
  11. 好文力荐 | MySQL 索引、B+树原理以及建索引的几大原则
  12. Linux下Zend Framework的“Invalid Controller Specified”问题
  13. C#判断一个string是否为数字 --zt
  14. Python基于ImageAI实现完整的流程:数据集构建、模型训练、识别预测
  15. 《广义动量定理与系统思考——战争、…
  16. 会议安排(贪心算法和动态规划)
  17. 搭建PHP网站开发环境
  18. LSTM之父发文:2010-2020,我眼中的深度学习十年简史
  19. 转贴汪应果先生的“全球华人应该向大陆中国人学什么?”
  20. Word章节自动编号+题注自动编号+公式编号+交叉引用

热门文章

  1. 5_区块结构和交易结构分析
  2. pip install报错:Missing dependencies for SOCKS support解决方法
  3. 金九银十,金三银四(下)
  4. 企业大数据战略规划,看这一篇文章就够了!
  5. ECharts 学习
  6. 计算机考试金麦圈编号教程,计算机二级数据处理.docx
  7. 人生的智慧 读书笔记
  8. GRANT 赋于权限
  9. c语言 int大端转小端,C++将整型数据转换成大端或小端存储顺序
  10. [牛客/校招编程真题][C++]建物流中转站