转录组测序完成后,一般我们会获得一个原始 read count表达矩阵,其中行是基因,列是样品。常用的差异分析工具包括limma、edgeR和DESeq2。DESeq2在测序领域使用最为广泛(google scholar引用高达43284次,edgeR为28076次)。小编今天给大家介绍下我们的在线DESeq2差异分析模块,小伙伴们可以零代码进行GEO数据库表达矩阵的挖掘,后续再利用我们平台的各种绘图模块出图,大大加速了我们的科学研究。

1.打开绘图页面

首先,使用浏览器(推荐chrome或者edge)打开DESeq2差异分析页面。左侧为常见作图导航,中间为数据输入框和可选参数,右侧为描述和结果示例。也可以在搜索框中搜索deseq2,找到分析页面。

微生信-在线转录组(mRNA-seq等)raw counts DESeq2标准化及差异表达分析

图1,DESeq2分析页面

2,示例数据

点击右侧“示例数据”链接下载excel格式的示例数据。

图2. Raw count输入数据示例

示例raw count矩阵包括8列:

第1列是基因id,必需唯一;

第2-4列是DHT组3个样品;

第5-8列是Control组4个样品。

图3. 比较方案输入数据示例

示例分组比较方案包括5列:

第1列是实验组的样品列表,共3个,英文逗号分隔

第2列是对照组的样品列表,共4个,英文逗号分隔

第3列是实验组组名

第4列是对照组组名

第5列是样品配对与否,unpaired表示非配对,paired表示配对。例如从1号、2号、3号共三个患者身上分别取癌症样品cancer1,cancer2,cancer3,对照样品norm1,norm2,norm3,那么paired配对比较时,顺序不能变,即:1号患者的cancer1,对应1号患者的norm1;2号患者的cancer2对应2号患者的norm2;3号患者的cancer3对应3号患者的norm3。而非配对比较(unpaired)则不考虑这种对应关系。

3,粘贴示例数据

拷贝示例数据中A-H列的raw count数据,粘贴到矩阵输入框。

拷贝J-N列的比较信息,粘贴到比较输入框。

注意:不是拷贝excel文件,是拷贝excel文件里边的数据。另外粘贴到输入框后,格式乱了没关系,只要在excel中是整齐的就行。同时数据矩阵中不能有空的单元格,中文字符等。

图4. 必需输入-raw count矩阵

图5. 必需输入-比较方案

4,修改参数,并提交

我们设置了原始count数之和的过滤最小过滤参数,默认不过滤。

图6.过滤参数

5,提交获得结果

粘贴好输入数据,调整好参数后,点击提交按钮,约60秒钟后,会在页面右侧出现结果下载链接。下载并解压后,可以使用excel打开并利用筛选功能根据fold change和p值筛选差异表达基因,绘制热图,火山图,进行功能富集分析。

图7.结果下载

结果说明

由于我们未对低表达值进行过滤,因此,输入矩阵是多少个基因,分析结果也是多少个基因。

第1个sheet是表达谱,包括原始count和标准化count

第2+个sheet是差异总表。

图8. 差异结果

Fold change:两组间的倍数变化。正表示上调,负表示下调

Log2FoldChange:log2转化的倍数变化。正表示上调,负表示下调

Pvalue:p值

Padj:校正的p值

Regulation:上调或下调

*(mean):各组的标准化表达均值

不同平台相互印证测试

除了阅读DESeq2官方文档并使用官方代码外,我们还使用相同的raw count矩阵测试了其他4个第三方平台:DEApp,基迪奥,欧易,sangerbox。在这5个平台中,微生信的结果和sangerbox完全一样,而与其他3个平台的结果均略有差异(见图9)。图中所示785个基因是4种平台共有的,约占90%以上。

                                                             图9. 4种平台上调结果比较

究其原因,可能主要是内部filter过滤参数不一致造成的。在DESeq2官方文档中:While it is not necessary to pre-filter low count genes before running the DESeq2 functions, there are two reasons which make pre-filtering useful: by removing rows in which there are very few reads, we reduce the memory size of the dds data object, and we increase the speed of the transformation and testing functions within DESeq2. It can also improve visualizations, as features with no information for differential expression are not plotted.

意思就是过滤低表达量的基因不是必需的,过滤的用途包括:1,减少dds对象内存占用,提高计算速度;2,改善可视化。可以使用所有样品的均值过滤,也可以使用组内样品的均值进行过滤,在不确定过滤参数的情况下会出现结果差异的现象。

虽然我们参考的都是官方文档,但是由于大家对官方文档的具体细节处理、具体参数使用等存在差异,因此导致各个平台的结果略有差异,但是总体相差较小,基本不影响结果。

微生信助力高分文章,用户58000+,引用750+

使用DESeq2进行转录组原始count标准化和差异分析相关推荐

  1. 用DESeq2包来对RNA-seq数据进行差异分析

    用DESeq2包来对RNA-seq数据进行差异分析 差异分析的套路都是差不多的,大部分设计思想都是继承limma这个包,DESeq2也不例外. DESeq2是DESeq包的更新版本,看样子应该不会有D ...

  2. JSTA:将空间转录组原始数据转换成单细胞水平空间表达谱的专用工具

    基于RNA杂交的空间转录组方法提供了极高的RNA检测准确率.然而其需要使用图像分割算法将图像分割成细胞,将RNA检测转换为空间单细胞数据.把mRNA分配给细胞仍然是一个具有挑战性的问题,会大大影响组合 ...

  3. 基于Salmon的转录组批量定量流程和差异分析

    继续前文:基于Salmon的转录组定量流程 循环定量多个样品的表达量 整理样本信息表,命名为sampleFile,内容如下: Samp conditions individual untrt_N613 ...

  4. 转录组分析流程:表达差异分析之edgeR

    edgeR edgeR是非常经典的转录组表达差异分析软件. 样本量:72个转录组样本 library(edgeR) library(HTSFilter)fc <- read.table('cou ...

  5. 带有RESTEasy + JAXB + Jettison的JSON示例

    RESTEasy使用Jettison JSON库在JSON之间来回映射JAXB注释对象. 在本教程中,我们向您展示如何将带​​有JAXB注释的对象转换为JSON格式并将其返回给客户端. 杰克逊(Jac ...

  6. 【生信学习第一天】DEseq2 差异表达基因计算

    一.介绍 分析来自 RNA-seq 的计数数据的一项基本任务是检测差异表达的基因.计数数据以表格的形式呈现,其中报告了每个样本已分配给每个基因的序列片段的数量.其他检测类型也有类似的数据,包括比较 C ...

  7. 120分的转录组试题和答案

    120分的转录组试题和答案 120分的转录组试题和答案 这个答案之前出过三份,最近整理了一份文本版,方便观看,还请大家多多补充. 120分的转录组试题(第一份答案) 120分的转录组试题(第二份答案) ...

  8. Nat. Commun. | 从单细胞转录组数据中学习可解释的细胞和基因签名嵌入

    本文介绍由加拿大麦吉尔大学与蒙特利尔高等商学院.北京大学.复旦大学的研究人员联合发表在Nature Communications的研究成果:本文作者提出了单细胞嵌入式主题模型scETM(single- ...

  9. R语言安装DESeq2包

    R语言DESeq2包 R语言DESeq2包介绍 DESeq2包是为高维计数教据的归一化,可视化和差分分析而设计的.它利用经验贝叶斯技术对数折矗变化和离散的先验,并计算这些量的冠验估计.分析RNA序列数 ...

最新文章

  1. linux添加域名证书,在Linux服务器上手动安装免费的Let's Encrypt域名证书 - 乐道主机...
  2. linux 启动两个摄像头,Linux:(多摄像头)如何运行指定的摄像头
  3. LInux线程——多线程与fork之间的问题
  4. oracle用命令方式创建表,oracle创建表的方法和一些常用命令
  5. CSS绘制放大缩小关闭按钮
  6. python时间戳_Python-强大的模块功能库-No11
  7. 从被动到主动,换个角度看 DB
  8. 基于Verilog实现呼吸灯
  9. Xamarin.Android 引导页
  10. 你要好好的---歌词
  11. C#/VB.net/VB 获取系统时间
  12. Android 处理软键盘遮挡问题
  13. 计算机老师一句话,40句感恩教师的一句话
  14. QQ邮箱代收Gmail邮件,微信第一时间通知Gmail新收邮件
  15. Python学习笔记 TypeError: not all arguments converted during string formatting
  16. wps转word WPS表格如何实现冻结窗格呢
  17. (二) 数据挖掘之分类
  18. 天蝎座2006年运程
  19. 【PAT】06 图论
  20. 西门子 S7协议 数据位

热门文章

  1. iOS-强制横屏大总结
  2. php 正则 花括号,JS+正则取得小括号、中括号及花括号内容步骤详解
  3. 计算机专业硕士毕业认定职称,研究生毕业可以直接认定中级职称吗?
  4. 【转载】:创业是一种心态、信念和坚持,是一种生活方式!
  5. layui里的倒计时
  6. 大话设计模式1 简单工厂模式 策略模式
  7. 量子优势_我是亲民_新浪博客
  8. 安装git 淘宝镜像
  9. 作为第一社区,我认为CSDN的MarkDown应该升级了|CSDN编辑器测评
  10. BIOS和BootLoader uboot