一文掌握R包DESeq2的差异基因分析过程 - 简书

DESeq2包分析需两个矩阵:

1 count矩阵(必须为matrix)

行为Sample id

2 group矩阵(matrix或dataframe)

有Sample和Group的对应关系,顺序不重要;

Group列变量类型为factor;

library("TCGAbiolinks")
library("stringr")
library("DESeq2")

 一、读入数据

dataFilt=read.csv(file = "Results/测序or临床数据下载/dataFilt.csv", header=T, row.names=1,check.names=FALSE)
dataFilt=as.matrix(dataFilt)
colnames(dataFilt)=str_sub(colnames(dataFilt),1,12) #取病人编号,即前12位gene_gleason=read.csv(file = "Results/不同gleason评分的SMC4表达/gene_gleason.csv", header=T, row.names=1,check.names=FALSE)
gene_gleason=gene_gleason[,-2]
colnames(gene_gleason)[2]='Group'

View(dataFilt)

View(gene_gleason)

 二、确定分组

 1 gleason评分降序排列

t_index=order(gene_gleason$Group,decreasing = T)
gene_gleason=gene_gleason[t_index,] #调整Sample顺序,使gleason评分降序排列
rownames(gene_gleason)=c(1:nrow(gene_gleason)) #行名从1开始

 View(gene_gleason)

2 分组,gleason大于等于8为high_gleason,小于等于7为low_gleason

gene_gleason$Group[1:197]='high_gleason'
gene_gleason$Group[198:nrow(gene_gleason)]='low_gleason' #制定分组

3 得到group矩阵,即design

design=gene_gleason
design$Group=as.factor(design$Group) #character转factor

View(design)

三、DESeq2分析

上述的dataFilt、design即为构建好的count矩阵、group矩阵

1 dds、dds1、res三步走

dds <- DESeqDataSetFromMatrix(countData = dataFilt, colData = design, design= ~Group) #countData需要一个count matrix,colData需要一个有分组信息的dataframe,design需要指定分组信息中的列
dds1 <- DESeq(dds,fitType = 'mean')
res <- results(dds1, contrast = c('Group', 'high_gleason', 'low_gleason')) #Group对应上面的“design= ~Group”,且high_gleason在前,low_gleason在后

2 输出结果

result <- data.frame(res, stringsAsFactors = FALSE, check.names = FALSE)

View(result)

后面就可以进行下游分析了!

TCGA_DESeq2分析_Gleason H vs L相关推荐

  1. TCGA_DESeq2分析_TP vs NT

    本篇是对"测序数据下载"."DESeq2分析"的综合应用,因此会少一些说明: "测序数据下载"详见 TCGA_改版后STAR-count处理 ...

  2. linux内核中链表代码分析---list.h头文件分析(二)【转】

    转自:http://blog.chinaunix.net/uid-30254565-id-5637598.html linux内核中链表代码分析---list.h头文件分析(二) 16年2月28日16 ...

  3. 增强vim中文移动h与l

    我把vim的h与l分别映射为2个h/l了, 然后gh/gl分别映射为h/l了,这样移动中文就方便了,以词为单位. gh原为可选模式,不过用不来.所以就映射为最小移动单位了. 还有一个r可以利用,这个r ...

  4. linux内核中链表代码分析---list.h头文件分析(一)

    linux内核中链表代码分析---list.h头文件分析(一) 16年2月27日17:13:14 在学习数据结构时,有一个重要的知识点就是链表.对于链表的一些基本操作,它的最好学习资料就是内核中的li ...

  5. E+H FMX21-AA121CGD15A L=3m 液位计

    E+H FMX21-AA121CGD15A L=3m 液位计 静压式 液位测量 Waterpilot FMX21 采用陶瓷测量元件和HART协议的液位传感器,坚固可靠 Waterpilot FMX21 ...

  6. 2018CCPC桂林站题解(D G H J L)

    题目链接:http://codeforces.com/gym/102823 问题 D: Bits Reverse 时间限制: 1 Sec  内存限制: 128 MB 提交: 167  解决: 127 ...

  7. 2021/10/24 2021ICPC江西省赛 部分个人题解 A,B,H,K,L,J

    K Many Littles Make a Mickle 题目大意:有t组输入,每组输入一个n,一个m,表示有n层,第i层有i*i个房间,每个房间有m个人,求有多少人. 题解:数据小,暴力求和即可(也 ...

  8. 【C语言学习趣事】_GCC源代码分析_2_assert.h

    我记得在以前的一篇随笔中,我堆windows下的<assert.h>进行了分析,今天我们来看看gcc中这个文件的定义是怎样的. [1]assert宏的作用 assert宏实现断言的作用,一 ...

  9. The 15th Heilongjiang Provincial Collegiate Programming Contest (A、G、H、L)

    The 15th Heilongjiang Provincial Collegiate Programming Contest A. August G. Goodbye H. Hate That Yo ...

最新文章

  1. VC网络通信API概览
  2. 前端学习(3285):立即执行函数四
  3. 纽约佩斯大学孔子学院:中国故事
  4. js中将有层级关系的一维数据转换为父子级关系的二维数据、菜单权限三级层级数据实现(树形结构数据)
  5. [转]CPU/GPU/TPU/NPU...XPU都是什么鬼
  6. 判断图片文件真实类型---通过文件表头判断。
  7. tomcat启动时,没有启动你所配置的项目(原因可能是Eclipse 中的工程builed 失败造成),如何解决~
  8. Bailian4077 出栈序列统计【卡特兰数】(vijos P1122)
  9. jboss7学习2-jboss7入门(端口和访问的ip问题)
  10. Sql中Output参数用法和分页存储过程
  11. 传统推荐系统算法(一):协同过滤(Collaborative Filtering,CF)
  12. Matlab运算符总结
  13. html5 mp4转换ogv格式,如何将mp4视频转换成ogv高清视频呢
  14. 3D物体标签(随镜头远近,调整自身大小)
  15. 廉洁文化 计算机学院,资讯抢先看 | 廉洁文化主题活动优秀作品锦集,请查收~...
  16. 【自动化测试】Selenium IDE脚本编辑与操作(了解)
  17. Python学习笔记--Python 爬虫入门 -17-5 js 加密 (和有道词典的瓜葛)
  18. c语言大数运算知乎,为什么知乎上大多数人不推荐C语言入门?
  19. 【深度学习系列】数据预处理
  20. Android LCD(一):LCD基本原理篇(一/四)

热门文章

  1. 轻松解决:无法更新app,因为此项目已退款或通过其他id购买
  2. 自然语言处理情感分析matlab,自然语言处理中的情感分析
  3. 毕业论文知识点记录(二)——环境数据下载之全球土壤数据下载(非时序性)
  4. java 包装类可以被继承_小白学Java:包装类
  5. 设置默认网关端口 android,IP设置默认网关的方法 | 192.168.1.1手机登陆
  6. 高光谱辐射计(Hyperspectral Ocean Color Radiometers)
  7. h3c s5048交换机基本配置
  8. 软考笔记七、无线通信网
  9. php 大转盘 抽奖概率算法
  10. img src=hi onerror=confirm('厉害了word哥!!')