(一)R函数

  R是一种解析型语言,输入后可直接获取结果

函数(输入参数,参数)

  R的函数分为“高级”和“低级函数”
    • 高级函数可调用低级函数
    • 高级函数称为泛型函数

  • 函数名  <-­‐  funcion(数据,参数=1,默认值){
    •     异常处理
    •     表达式
  •     return  返回值
  • }

(二)R赋值与注释

  • 2+2  
  • a  <  -­‐2
  • c  <-­‐  a+b

  • #注释

(三)对象起名

  • 1.区分大小写,China与china不同
  • 2.不能用数字作为变量,对象也不能用数字开头
  • 3.保留字
  – NA,NaN,Pi,LETTERS,leBers,month  等

(四)元素的类型

  • 数值型,Numeric
  • 字符串,Character
  • 逻辑型,Logical
  • 因子型,Factor
  • 复数型,Complex  如2+3i

  • 向量(vector),一系列元素
    –  c(1,2,3);c(“a”,”a”,”b”,”b”,”c”)
  • 因子(factor)   因子是一个分类变量
  • c(“a”,”a”,”b”,”b”,”c”)
  • 矩阵(matrix),二维的数据表,是一个数组的特例

  • 数组(array)
    – 数组是k维的数据表(k  in  1:n  ,n  为正整数)
  • 数据框(dataframe)
    – 是由一个或几个向量和因子构成,他们必须是等长的,但可以是不同但数据类型
  • 列表
  – 列表可以包含任何类型的对象
  – 可以包含向量、矩阵、高维数组也可以包含lixt

运算符

  • 数学运算
    – +,-­‐  ===
  • 比较运算 返回true  or  false
    – >,<,<=,>=,==
  • 逻辑运算
    – !,&,&&,|,||

外部数据读取

  • read.table()
  • read.csv()  读取csv或者
  • 可以直接通过某些程序包读取excel等格式数据

  • read.csv(‘file’,header=T)
    – header=T  表示将数据的第一行作为标题

类的判断

  • mode()  判断存储类型
  • class(),判断数据的类

    • is.numeric()
    • is.logical()
    • is.charactor()

数据框内元素的引用

  • intake  <-­‐  data.frame(intake.pre,intake.post)
  • 1.  $  引用列,后面为列的名称
    – 例如:intake$  intake.pre
  • 2.  [,]  方括号,逗号前为行,逗号后为列
    • intake[,1]
    • I  =  1:5;intake  [i,]

类的转换

  • as.numeric()
  • as.logical()
  • as.charactor()
  • as.matrix()
  • as.data.frame()
  • as.factor()

(五)R操作Json

  1.安装Json

  2.加载进GUI中

  3.从json转到R上

  4。class判断类型,cat输出不带横线的json字符串,peint输出的带有/,可以通过$取到深层次的json串,最内层的可以用[]去得到

5.将toJson之后字符串输出到文件使用sink或者writeLines

(六)R 语言不仅在统计分析和数据挖掘领域计算能力强大,它在数据可视化领域也不逊于
昂贵的商业软件。当然,R 在可视化上强大,其背后离不开各种开源软件包的支持,Cairo
就是这样一个用于矢量图形处理的类库。Cairo 可以创建高质量的矢量图形 (GIF、SVG、
PDF、PostScript) 和位图 (PNG、JPEG、TIFF),同时支持在后台程序中高质量渲染!本节
将介绍 Cairo 在 R 语言中的使用。

1.安装

2.加载进GUI并检查Cairo包支持的图片格式

3.画散点图

(七)R中的时间序列基础库ZOO

时间序列分析是一种动态数据处理的统计方法,通过对时间序列数据的分析,我们可
以感觉到世界正改变着什么! R 语言作为统计分析的利器,对时间序列处理有着强大的支
持。在 R 语言中,单独为时间序列数据定义了一种数据类型 zoo,zoo 是时间序列的基础,
也是股票分析的基础。本节将介绍 zoo 库在 R 语言中的结构和使用。

1.介绍

zoo 是一个 R 语言类库,zoo 类库中定义了一个名为 zoo 的 S3 类型对象,用于描述规
则的和不规则的有序的时间序列数据。zoo 对象是一个独立的对象,包括索引、日期、时
间,只依赖于基础的 R 环境。zooreg 对象继承了 zoo 对象,只能用于规则的时间序列数据。
R 语言中很多其他的程序包,都是以 zoo 和 zooreg 作为时间序列数据的基础的!

  zoo 包的API 主要有 6 类

(1)基础对象
  zoo: 有序的时间序列对象。
  zooreg: 规则的时间序列对象,继承 zoo 对象。与 zoo 相比,不同之处在于 zooreg 要求数据是连续的。
(2)类型转换
  as.zoo: 把一个对象转型为 zoo 类型。
   plot.zoo: 为 plot 函数提供 zoo 的接口。
   xyplot.zoo: 为 lattice 的 xyplot 函数提供 zoo 的接口。
   ggplot2.zoo: 为 ggplot2 包提供 zoo 的接口。
(3)数据操作
  coredata: 查看或编辑 zoo 的数据部分。
   index: 查看或编辑 zoo 的索引部分。
  window.zoo: 按时间过滤数据。
  merge.zoo: 合并多个 zoo 对象。
  read.zoo: 从文件读写 zoo 序列。
aggregate.zoo: 计算 zoo 数据。
rollapply: 对 zoo 数据的滚动处理。
rollmean: 对 zoo 数据的滚动计算均值。
(4)NA 值处理
na.fill: NA 值的填充。
na.locf: 替换 NA 值。
na.aggregate: 计算统计值替换 NA 值。
na.approx: 计算插值替换 NA 值。
na.StructTS: 计算季节 Kalman 滤波替换 NA 值。
na.trim: 过滤有 NA 的记录。
(5)辅助工具
is.regular: 检查是否是规则的序列。

lag.zoo: 计算步长和差分。
MATCH: 取交集。
ORDER: 值排序,输出索引。
(6)显示控制
yearqtr: 以年季度显示时间。
yearmon: 以年月显示时间。
xblocks: 作图沿 x 轴分割图形。
make.par.list: 用于给 plot.zoo 和 xyplot.zoo 数据格式转换。

  

转载于:https://www.cnblogs.com/jackchen-Net/p/5143043.html

R-大数据分析挖掘(5-R基础回顾)相关推荐

  1. 大数据分析Python和R语言的优缺点

    从主观的角度来看,已有数十篇文章比较了Python与R.大数据分析Python和R语言的优缺点旨在更客观地研究语言.我们将在Python和R中并排分析数据集,并显示两种语言需要哪些代码才能获得相同的结 ...

  2. 初探百度大数据分析挖掘平台Jarvis

    在人工功能时代,企业既想通过大数据分析.挖掘技术提升效率,又被大数据量分析.机器学习挖掘等相关技术门槛阻扰,需要一款数据分析挖掘产品跨越这个鸿沟.Jarvis在这个背景下应运而生.Jarvis是支撑大 ...

  3. 天律的云端大数据分析挖掘之旅

    原文链接:http://click.aliyun.com/m/13921/ 随着数据爆炸式的增长,我们正被各种数据包围着,最为平常的使用网络.手机.各种电子设备,每天都在产生各种新的数据.大部分的企业 ...

  4. 大数据分析工程师入门8--Spark基础

    本文为<大数据分析师入门课程>系列的第8篇,主要讲解大数据分析师必须了解的Spark基础知识,前7篇分别是JAVA基础.SCALA基础.SQL基础.SQL进阶.HIVE基础.HIVE进阶. ...

  5. 在大数据分析/挖掘领域,哪些编程语言应用最多?

    Tim Roy  ,原来我也在这里 9 人赞同 更新一下答案-- 之前我提到用R,后来我自己也觉得有点撑不住,应该是技术不行吧.还是建议往Python方向发展. Python不局限于数据分析,还有许多 ...

  6. python语言在大数据分析处理领域应用广泛_在大数据分析/挖掘领域,哪些编程语言应用最多...

    展开全部 在大数据分复析/挖掘领域,编程语制言目前应用最多的bai应该是Python.Python并不简单,除了数du据分析zhi及挖掘,Python还被dao广泛运用到数据爬取.产品开发等领域. 那 ...

  7. 大数据分析技术之JAVA基础(一):数据类型

    写在前面:这几天开学了学校开了大数据课程,前期需要学习JAVA的基础,所以我打算开一个JAVA的学习系列,这个就当自己学习的一个记录,方便期末复习. 学习内容安排 JAVA基础课程学习:数据类型(一) ...

  8. python分析基金数据_python基金会(大数据分析),的,PYTHON,基础,选择,练习

    第一章 单元测试 1.判断题: Python语言是一种高级语言. 选项: A:对 B:错 答案: [对] 2.多选题: Jupyter notebook中运行单元格的方法有哪几种?( ) 选项: A: ...

  9. python大数据处理与分析课程目标_《大数据分析与挖掘》课程教学大纲

    1 <大数据分析与挖掘>课程教学大纲 一.课程基本信息 课程代码: 16054103 课程名称:大数据分析与挖掘 英文名称: Big data analysis and mining 课程 ...

最新文章

  1. 算法导论——所有点对最短路径:稀疏图Johnson算法
  2. Oracle Linux 6.1 说明
  3. python bottle web框架上传静态文件与加载静态文件
  4. C语言中的标识符作用域
  5. python动态时钟代码_python绘制动态时钟
  6. iphone6s发布会_iPhone 6S/SE升级iOS 13性能测试:App启动速度比iOS 12.4.1慢
  7. 银行贷款(洛谷P1163题题解,Java语言描述)
  8. 三星Galaxy S10 5G版手机国行版或今日发布 在韩销量已超100万部
  9. 怎样写出没有bug的代码?
  10. 《python编程》第五章——并行系统工具(上)
  11. 实习也能这样过!节选
  12. 拓端tecdat|如何在R语言中建立六边形矩阵热图heatmap可视化
  13. python与分形0011 - 【教程】带辐条的多边形
  14. 微信去除 防欺诈盗号请勿支付或输入qq密码 以及 防欺诈或盗号请不要输入qq密码 的方法
  15. R语言绘制bivariate polar plots
  16. shipyard管理多HOST
  17. 带你认识世界最值钱的十种货币
  18. 安卓视线可锁定首行和首列的表格视图
  19. 关于前端的CSS命名
  20. 机器学习讲堂 ACF 聚合通道检测

热门文章

  1. 【CodeForces - 520B】Two Buttons (bfs或dp或时光倒流,trick)
  2. android app 移植到pc,微软开发新应用把Android app“移植”到Win Phone
  3. java中js九个隐含对象_第九章 JSP标签——《跟我学Shiro》
  4. css现在还用浮动吗,css3-9 css中的浮动怎么使用
  5. python 拼多多_拼多多现重大BUG被“薅羊毛”,教你如何用Python简单褥羊毛
  6. 求1~n这n个整数十进制表示中1出现的次数
  7. leetcode543. 二叉树的直径
  8. leetcode76 最小覆盖子串
  9. android 全局 窗口,miui12全局自由窗口app
  10. 夫曼编码译码系统课程设计实验报告(含源代码c++_c语言),哈夫曼编码译码系统课程设计实验报告(含源代码C++_C语言)[1]...