本文目的

因为暂时没有实验安排,所以就学习一些额外的知识。没有一个实操的过程,那就特此记录一下,留个印象吧。

目录

(一)数据处理 主要讲的内容是如何读取文件,常用格式以及特殊格式json与xml
(二) 代码逻辑
(三)常用管道符 %>%,%T>% ,
(四)解析变量方法原理,readr包读取数据的部分特点
(五)为什么解析器那么复杂,规则的不同,如何用好解析器。在不知道具体编码的情形下,如何猜测解码方式
(六)readr 如何猜测每列类型,以及使用read_csv时,类型信息会丢失掉,可以考虑保存为RDS文件
(七)tibble类型的引入
(八)dplyr包的介绍与使用,filter函数,between函数
(九)dplyr包的arrange(排序)、select(筛选) 、mutate(添加新列),这边select函数可以使用正则或批量效应
(十)summarise 配合group_by 实现分组统计,summarise里面有某些特定的内置统计函数
(十一)dplyr连接数据库,主键与外键。如join的功能,内连接,外连接,全连接等
(十二)tidyr 包降解,数据的整洁之道。
三原则:
1)每个变量必须要有自己的列
2)每个观察值必须在自己行中
3)每个值必须在自己的单元格内
长宽数据转换,什么是长数据,什么是宽数据。
(十三)separate 函数 ,分割列。 多列合并为一列,unite,以及用了一个例子实现了对数据的清理
(十五)forcat,对因子变量进行操作

包所包含的函数图

1.dplyr


2.readr + stringr + tidyr


R 数据处理 流程目录及总结(学习生信学习手册的自我梳理)相关推荐

  1. 生信学习——R语言练习题-初级(附详细答案解读)

    题目目录 1. 打开 Rstudio 告诉我它的工作目录. 2. 新建6个向量,基于不同的数据类型.(重点是字符串,数值,逻辑值) 3. 告诉我在你打开的rstudio里面 getwd() 代码运行后 ...

  2. 生信学习——R语言学习总结

    写在前面--经过了四十天断断续续的学习,算是对R语言有了初步的了解.其实使用R语言,无非就是对数据进行处理分析,然后把结果可视化.但是数据的千变万化,还有数以万计的函数.数据格式,使得这个过程变得很复 ...

  3. 有没有人带?这些都是学习生信的一大助力!

    经常能看到某人5篇SCI! 某实验室10篇SCI! 科研学习过程中,一年多篇文章的人是如何保持科研创新能力的? 及时关注学界动态,高效获取优质资源非常重要. 但是大量的科研资讯,热点也层出不穷,那么作 ...

  4. 学习生信的系列教程 | 留言您是如何学习生信的免费获取北大出版《Python数据分析》书籍...

    生信的作用越来越大,想学的人越来越多,不管是为了以后发展,还是为了解决眼下的问题.但生信学习不是一朝一夕就可以完成的事情,也许你可以很短时间学会一个交互式软件的操作,却不能看完程序教学视频后就直接写程 ...

  5. 生信宝典教程大放送,一站式学习生信技术

    生物信息学包含生物数据分析.数据可视化.重复工作程序化,是生物.医学科研必备的技能之一.生信宝典精心组织生信学习系列教程.生信工具精品教程,通过大量的生信例子.关键的注释.浓缩的语句和录制的视频帮助快 ...

  6. 送书 | 知乎阅读300w+的生信学习指南(更新版)

    先送书 在上周的留言送书活动中,恭喜下面这位读者获得书籍"Oracle高性能系统架构实战大全",请及时与生信宝典编辑(shengxinbaodian)联系. 2020过去三分之一了 ...

  7. 生信宝典文章集锦,一站式学习生信!众多干货,有趣有料

    生信的作用越来越大,想学的人越来越多,不管是为了以后发展,还是为了解决眼下的问题.但生信学习不是一朝一夕就可以完成的事情,也许你可以很短时间学会一个交互式软件的操作,却不能看完程序教学视频后就直接写程 ...

  8. 这是入门生信,学习生信分析思路和数据可视化的首选?

    封面来源:https://www.zhihu.com/question/304747766 常规转录组是我们最常接触到的一种高通量测序数据类型,其实验方法成熟,花费较低,是大部分CNS必备的技术,以后 ...

  9. 生信学习学的是什么?常识!

    生物信息学学的是什么?常识! 学习的是基本生物学概念的常识! 学习的是计算机基础的常识! 学习的是图形解读的常识! 学习的是统计的常识! 拦住生信学习脚步的不是技术有多难,而是有些常识你还不知道. 这 ...

最新文章

  1. linux中cooy命令_Linux复制指令
  2. android studil打断点_【小技巧】AndroidStudio利用断点打印日志
  3. what format should you export from matlab?
  4. Nginx和lvs在负载均衡方面的对比
  5. select2 change之前的改变
  6. 使用springaop技术面向切面编程
  7. 深度探索Win32可执行文件格式
  8. Django--ORM基本操作
  9. JSP教程第4讲笔记
  10. Swift - 实现公历、农历日期之间的相互转换
  11. codeigniter3 全面集成 phpunit
  12. JVM面试知识点合集 — Android 春招 2022
  13. BSN智能合约开发培训-CITA(三)
  14. 任何经历,都是一种积累
  15. ArcGIS学习教程(一)
  16. ie检查服务器证书吊销,浏览器提示“该站点安全证书的吊销信息不可用”的解决方法...
  17. Dubbo-05 20190317
  18. 如何识别骗子广告联盟,骗子广告联盟常用手段
  19. HMS Core Drive SDK构建使用华为云空间服务应用程序
  20. TAQ服务器npc多久自动交物资,魔兽怀旧服: 安其拉开门NPC自动交物资竟是忽悠玩家? GM聊天曝出...

热门文章

  1. android中setdate不是静态,android – putExtra()和setData()之间的区别
  2. java文件读写long_Java文件的简单读写、随机读写、NIO读写与使用MappedByteBuffer读写...
  3. ios获取4g_VSCO全滤镜解锁!安卓iOS都没问题!!赶紧下载!手慢拍大腿
  4. “我只买黄金现货不买黄金股票,那是纸上黄金”
  5. 摘:MD231 gprs模块建立tcp或udp连接,AT命令详细参考
  6. ADOBE CS3 安装相关问题解决
  7. bool类型_Python3.7知其然知其所以然-第七章 类型转换
  8. excel导入mysql实验_「excel数据库」将excel表导入数据库的方法步骤 - seo实验室
  9. 医院(门诊)管理系统基本功能
  10. CentOS 7 minimal安装与使用(cpp-py) opencv静态编译