TCGA_DESeq2分析_Gleason H vs L
一文掌握R包DESeq2的差异基因分析过程 - 简书
DESeq2包分析需两个矩阵:
1 count矩阵(必须为matrix)
行为Sample id
2 group矩阵(matrix或dataframe)
有Sample和Group的对应关系,顺序不重要;
Group列变量类型为factor;
library("TCGAbiolinks")
library("stringr")
library("DESeq2")
一、读入数据
dataFilt=read.csv(file = "Results/测序or临床数据下载/dataFilt.csv", header=T, row.names=1,check.names=FALSE)
dataFilt=as.matrix(dataFilt)
colnames(dataFilt)=str_sub(colnames(dataFilt),1,12) #取病人编号,即前12位gene_gleason=read.csv(file = "Results/不同gleason评分的SMC4表达/gene_gleason.csv", header=T, row.names=1,check.names=FALSE)
gene_gleason=gene_gleason[,-2]
colnames(gene_gleason)[2]='Group'
View(dataFilt)
View(gene_gleason)
二、确定分组
1 gleason评分降序排列
t_index=order(gene_gleason$Group,decreasing = T)
gene_gleason=gene_gleason[t_index,] #调整Sample顺序,使gleason评分降序排列
rownames(gene_gleason)=c(1:nrow(gene_gleason)) #行名从1开始
View(gene_gleason)
2 分组,gleason大于等于8为high_gleason,小于等于7为low_gleason
gene_gleason$Group[1:197]='high_gleason'
gene_gleason$Group[198:nrow(gene_gleason)]='low_gleason' #制定分组
3 得到group矩阵,即design
design=gene_gleason
design$Group=as.factor(design$Group) #character转factor
View(design)
三、DESeq2分析
上述的dataFilt、design即为构建好的count矩阵、group矩阵
1 dds、dds1、res三步走
dds <- DESeqDataSetFromMatrix(countData = dataFilt, colData = design, design= ~Group) #countData需要一个count matrix,colData需要一个有分组信息的dataframe,design需要指定分组信息中的列
dds1 <- DESeq(dds,fitType = 'mean')
res <- results(dds1, contrast = c('Group', 'high_gleason', 'low_gleason')) #Group对应上面的“design= ~Group”,且high_gleason在前,low_gleason在后
2 输出结果
result <- data.frame(res, stringsAsFactors = FALSE, check.names = FALSE)
View(result)
后面就可以进行下游分析了!
TCGA_DESeq2分析_Gleason H vs L相关推荐
- TCGA_DESeq2分析_TP vs NT
本篇是对"测序数据下载"."DESeq2分析"的综合应用,因此会少一些说明: "测序数据下载"详见 TCGA_改版后STAR-count处理 ...
- linux内核中链表代码分析---list.h头文件分析(二)【转】
转自:http://blog.chinaunix.net/uid-30254565-id-5637598.html linux内核中链表代码分析---list.h头文件分析(二) 16年2月28日16 ...
- 增强vim中文移动h与l
我把vim的h与l分别映射为2个h/l了, 然后gh/gl分别映射为h/l了,这样移动中文就方便了,以词为单位. gh原为可选模式,不过用不来.所以就映射为最小移动单位了. 还有一个r可以利用,这个r ...
- linux内核中链表代码分析---list.h头文件分析(一)
linux内核中链表代码分析---list.h头文件分析(一) 16年2月27日17:13:14 在学习数据结构时,有一个重要的知识点就是链表.对于链表的一些基本操作,它的最好学习资料就是内核中的li ...
- E+H FMX21-AA121CGD15A L=3m 液位计
E+H FMX21-AA121CGD15A L=3m 液位计 静压式 液位测量 Waterpilot FMX21 采用陶瓷测量元件和HART协议的液位传感器,坚固可靠 Waterpilot FMX21 ...
- 2018CCPC桂林站题解(D G H J L)
题目链接:http://codeforces.com/gym/102823 问题 D: Bits Reverse 时间限制: 1 Sec 内存限制: 128 MB 提交: 167 解决: 127 ...
- 2021/10/24 2021ICPC江西省赛 部分个人题解 A,B,H,K,L,J
K Many Littles Make a Mickle 题目大意:有t组输入,每组输入一个n,一个m,表示有n层,第i层有i*i个房间,每个房间有m个人,求有多少人. 题解:数据小,暴力求和即可(也 ...
- 【C语言学习趣事】_GCC源代码分析_2_assert.h
我记得在以前的一篇随笔中,我堆windows下的<assert.h>进行了分析,今天我们来看看gcc中这个文件的定义是怎样的. [1]assert宏的作用 assert宏实现断言的作用,一 ...
- The 15th Heilongjiang Provincial Collegiate Programming Contest (A、G、H、L)
The 15th Heilongjiang Provincial Collegiate Programming Contest A. August G. Goodbye H. Hate That Yo ...
最新文章
- VC网络通信API概览
- 前端学习(3285):立即执行函数四
- 纽约佩斯大学孔子学院:中国故事
- js中将有层级关系的一维数据转换为父子级关系的二维数据、菜单权限三级层级数据实现(树形结构数据)
- [转]CPU/GPU/TPU/NPU...XPU都是什么鬼
- 判断图片文件真实类型---通过文件表头判断。
- tomcat启动时,没有启动你所配置的项目(原因可能是Eclipse 中的工程builed 失败造成),如何解决~
- Bailian4077 出栈序列统计【卡特兰数】(vijos P1122)
- jboss7学习2-jboss7入门(端口和访问的ip问题)
- Sql中Output参数用法和分页存储过程
- 传统推荐系统算法(一):协同过滤(Collaborative Filtering,CF)
- Matlab运算符总结
- html5 mp4转换ogv格式,如何将mp4视频转换成ogv高清视频呢
- 3D物体标签(随镜头远近,调整自身大小)
- 廉洁文化 计算机学院,资讯抢先看 | 廉洁文化主题活动优秀作品锦集,请查收~...
- 【自动化测试】Selenium IDE脚本编辑与操作(了解)
- Python学习笔记--Python 爬虫入门 -17-5 js 加密 (和有道词典的瓜葛)
- c语言大数运算知乎,为什么知乎上大多数人不推荐C语言入门?
- 【深度学习系列】数据预处理
- Android LCD(一):LCD基本原理篇(一/四)
热门文章
- 轻松解决:无法更新app,因为此项目已退款或通过其他id购买
- 自然语言处理情感分析matlab,自然语言处理中的情感分析
- 毕业论文知识点记录(二)——环境数据下载之全球土壤数据下载(非时序性)
- java 包装类可以被继承_小白学Java:包装类
- 设置默认网关端口 android,IP设置默认网关的方法 | 192.168.1.1手机登陆
- 高光谱辐射计(Hyperspectral Ocean Color Radiometers)
- h3c s5048交换机基本配置
- 软考笔记七、无线通信网
- php 大转盘 抽奖概率算法
- img src=hi onerror=confirm('厉害了word哥!!')