前言


在RNA-Seq的分析中,我们常用RPKM、FPKM和TPM作为转录组数据定量的表示方法。它们都是对表达量进行标准化的方法,为何不直接用read数表示,而选标准化呢,因为落在一个基因区域内的read数目取决于基因长度和测序深度。基因越长read数目越多,测序深度越高,则一个基因对应的read数目也相对越多。所以必须要标准化,而标准化的对象就是基因长度与测序深度。

RPKM

Reads Per Kilobase of exon modelper Million mapped reads (每千个碱基的转录每百万映射读取的reads),主要用来对单端测序(single-end RNA-seq)进行定量的方法。

RPKM(推荐软件,Range) 的计算公式:

RPKM= total exon reads/ (mapped reads (Millions) * exon length(KB));

total exon reads:某个样本mapping到特定基因的外显子上的所有的reads;

mapped reads (Millions) :某个样本的所有reads总和;

exon length(KB):某个基因的长度(外显子的长度的总和,以KB为单位)。

你可以用这个公式计算基因,外显子,转录本的表达,这里以基因的表达为例进行说明。在一个样本中一个基因的RPKM等于落在这个基因上的总的read数(total exon reads)与这个样本的总read数(mapped reads (Millions))和基因长度(exon length(KB)) 的乘积的比值。

FPKM

Fragments Per Kilobase of exon model per Million mapped fragments(每千个碱基的转录每百万映射读取的fragments),主要是针对pair-end测序表达量进行计算。

FPKM (推荐软件,cufflinks) 和RPKM 的计算方法基本一致。

FPKM和RPKM的区别就是一个是fragment,一个是read。对于单末端测序数据,由于Cufflinks计算的时候是将一个read当做一个fragment来算的,故而FPKM等同于RPKM。 对于双末端测序而言,如果一对paired-read都比对上了,那么这一对paired-read称之为一个fragment,而如果一对paired-Read中只有一个比对上了,另外一个没有比对上,那么就将这个比对上的read称之为一个fragment.而计算RPKM时,如果一对paired-read都比对上了会当成两个read计算,而如果一对paired-read中只有一个比对上了,另外一个没有比对上,那么就计read数为1。 故而即使是理论上将各个参数都设置成一样的,也并不能说FPKM=2RPKM。对于单末端测序,虽然理论上FPKM等同于RPKM, 但是实际上即使是使用同一个mapping软件得到的mapping结果,然后再分别去计算同一个基因的RPKM (自己人工计算,或者用现成的一些软件都能算)和FPKM(用Cufflinks计算),结果却仍然是不同,因为Cufflinks有自己的模型和自己的一些内在算法。

TPM

Transcripts Per Kilobase of exonmodel per Million mapped reads (每千个碱基的转录每百万映射读取的Transcripts),优化的RPKM计算方法,可以用于同一物种不同组织的比较。

TPM (推荐软件,RSEM) 的计算公式:

TPMi=(Ni/Li)*1000000/sum(Ni/Li+……..+ Nm/Lm)

Ni:mapping到基因i上的read数;

Li:基因i的外显子长度的总和。

在一个样本中一个基因的TPM:先对每个基因的read数用基因的长度进行校正,之后再用校正后的这个基因read数(Ni/Li)与校正后的这个样本的所有read数(sum(Ni/Li+……..+ Nm/Lm))求商。由此可知,TPM概括了基因的长度、表达量和基因数目。TPM可以用于同一物种不同组织间的比较,因为sum值总是唯一的。(不喜欢看公式分析,那么看看这个实例吧:http://www.bio-info-trainee.com/2017.html)

总结

不管是计算FPKM、RPKM,还是计算TPM,我们都要先得到一个ReadCount的矩阵(行为基因,列为样本)。在计算FPKM和RPKM时,都是先按列(也就是这个样本的总read数)进行标化,之后再对对个基因的长度进行标准化。而TPM是先对基因长度进行标准化,之后再对列(这个时候就不再是这个样本的总read数了)进行标化。这样使得最终的TPM矩阵的每列都相同(列和都等于1),也就是说每个样本中的TPM的和都是一样的。这样就会使得我们更容易去比较同一个基因在不同样本中所占的read数的比例。而RPKM/FPKM由于最终的表达值矩阵的列和不同,故而不能直接比较同一个基因在不同样本中所占的read数的比例。

RPKM、FPKM和TPM的区别相关推荐

  1. RPKM vs. FPKM vs. TPM

    1,全称 RPKM: Reads Per Kilobase Million FPKM: Fragments Per Kiolbase Million TPM: Transcripts Per Mill ...

  2. 转录组表达量计RPKM、FPKM、TPM说明

    在转录组测序(RNA-Seq)中,基因的表达量是我们关注的重点.基因表达量的衡量指标有:RPKM.FPKM.TPM. RPKM:Reads Per Kilobase Million:说实话,这个英文说 ...

  3. rsem比对_科学网—FPKM, RPKM, RPM以及TPM的关系之见解 - 江纯阶的博文

    FPKM,RPKM,RPM以及TPM的关系之见解 RPKM: Reads Per Kilobase of exon model per Million mapped reads (每千个碱基的转录每百 ...

  4. 理解:RPM、RPKM、FPKM、TPM、DESeq、TMM、SCnorm、GeTMM、ComBat-Seq

    文章目录 前言 为什么有不同的标准化表达单位(Expression Units) 理解Expression Units 和计算Calculation RPM or CPM 例子:RPM or CPM ...

  5. RPKM、FPKM、TPM

    RPKM.FPKM.TPM RPKM(Reads Per Kilobase per Million) 每千个碱基的转录每百万映射读取的reads数 FPKM(Fragments Per Kilobas ...

  6. 关于RNA-seq 的那点事Count 数的标准化 (一) RPKM 和FPKM,TPM及C(R)PM

    图片来自网络 我们都知道,在RNA seq 测序的过程中,我们测完序的最终目的是想根据测序的结果,最终分析得到差异基因以及潜在可能的功能分析,那么在进行差异分析以及对表达量进行分析的时候,对基因原始的 ...

  7. 转录本counts,FPKM,TPM相互转化

    FPKM: Fragments Per Kilobase of exon model per Million mapped fragments(每千个碱基的转录每百万映射读取的fragments) F ...

  8. Count,TPM,FPKM,CPM之间的格式转换——FPKM转TPM格式

    在做转录组分析,下载的数据有各种形式,比如count,FPKM,tpm.我今年2月份发表的一篇文章,小修审稿人提出FPKM过时了,建议我换成CPM. 我特地去pubmed查了查,发现CPM确实比FPK ...

  9. 衡量基因相对表达量的RPKM、FPKM、TPM详解

    衡量基因相对表达量的RPKM和FPKM.及TPM 1.RPKM(Reads Per Kilobase per Million)和FPKM(Fragments Per Kilobase per Mill ...

最新文章

  1. 跟刘强东、雷军等大佬聊天后,我总结了:如何结交牛人,跟大咖做朋友!
  2. NR 5G 网络功能之AMF
  3. Linux TCP拥塞控制算法原理解析
  4. Android中SearchView修改字体颜色
  5. mongodb学习篇
  6. 【php】命名空间的影响
  7. 深度学习表征的不合理有效性——从头开始构建图像搜索服务(二)
  8. 3W+字的设计模式手册
  9. 图论算法(三)--最短路径 的Bellman-Flod [ 带负权值图 ] 的解法(JAVA )
  10. Android 系统(41)---善用工具
  11. 外媒:苹果已有条件批准京东方为iPhone 13供应OLED屏幕
  12. 面试时,如何向公司提问?
  13. 开宗明义—UEFI介绍 (二)
  14. 零一块学计算机二级题库,2017年计算机二级office题库及答案
  15. mvn命令及生命周期
  16. 模拟电子技术 PN结的形成与工作原理 个人笔记
  17. fms安装教程 linux_linux通过fms搭建流媒体服务器Flash Media Server
  18. 支付宝内部功能调用APP的said说明
  19. 青春有多9,我爱我所有
  20. 监督学习和无监督学习简单理解

热门文章

  1. unable to read local cache ‘C:\\Users\\../gensim-data\\information.json‘ during fallback, connect to
  2. OKHttp网络请求封装
  3. 建筑工程竣工验收流程、程序、必备条件及备案,太全了
  4. VB银行代扣代发工资系统的设计与实现
  5. 中国商用燃气煎锅行业市场供需与战略研究报告
  6. Downloading https://ultralytics.com/assets/Arial.ttf to ...... yolov5报错解决
  7. 《Effective Modern C++》学习总结(条款11- 15)
  8. 管理者如何给员工沟通绩效
  9. 拥抱元宇宙,“虎视传媒们”靠什么打开想象力?
  10. 织梦标签调用:Dedecms模板常用调用标签代码整理