转自:https://baike.baidu.com/item/RPKM/1197657

均反应基因的表达水平

1.RPKM的计算公式

分母是总共比对到这个基因的reads的数目(条 为单位),分母是:比对上的reads的总数(百万条为单位);外显子的长度也就是基因的长度(KB为单位)。

2.举个计算的例子

3.为什么需要这样计算呢?

Reads Per Kilobase of exon model per Million mapped reads

具体含义是:每百万reads中来自于某基因每千碱基长度的reads数。

若是单纯以map到的read数来计算基因的表达量,在统计上是不合理的。

因为在随机抽样的情况下,序列较长的基因被抽到的机率本来就会比序列短的基因较高,如此一来,序列长的基因永远会被认为表达量较高,而错估基因真正的表现量。

4.FPKM计算公式

含义: FPKM代表每千个碱基的转录每百万映射读取的碎片。

两者就是分子不同,RPKM分子是reads,FPKM分子是fragment。

5. reads与fragment的区别

转自:https://www.cnblogs.com/jinhh/p/8964790.html

Reads即是指下机后fastq数据中的每一条Reads,Fragments则是指每一段用于测序的核酸片段,在SE中,一个Fragments只测一条Reads,所以,Reads数与Fragments数目相等;在PE中,一个Fragments测两端,会得到2条Reads,但由于后期质量或比对的过滤,有可能一个Fragments的2条Reads最后只有一条进入最后的表达量分析。总之,对某一对Reads而言,这2条Reads只能算一个Fragments.

转自:http://www.oebiotech.com/Article/jdcxzdcymc.html

Fragments:就是打成的片段,而测序测的就是这些fragments, 测出来的结果就是reads,又可以分为单端测序和双端测序,单端测序的话,只是从fragments的一端测序,测多长read就多长,双端测序就是从一个fragments的两端测,就会得出两个reads。

8.FPKM:将RPKM中的read换成freagment来理解。如果是single-end测序,二者FPKM和RPKM是一致的。如果是pair-end测序,每个fragments会有两个reads,FPKM只计算两个reads能比对到同一个转录本的fragments数量,而RPKM计算的是可以比对到转录本的reads数量。

转载于:https://www.cnblogs.com/BlueBlueSea/p/9896834.html

生信-RPKM与FPKM学习[转载]相关推荐

  1. 生信宝典,生物信息学习资源

    内容列表: R语言学习 - 热图简化 R语言学习 - 热图美化 R语言学习 - 基础概念和矩阵操作 R语言学习 - 热图绘制 (heatmap) R语言学习 - 入门环境Rstudio R语言学习 - ...

  2. 生信宝典:生物信息学习系列教程、视频、资源

    生信的作用越来越大,想学的人越来越多,不管是为了以后发展,还是为了解决眼下的问题.但生信学习不是一朝一夕就可以完成的事情,也许你可以很短时间学会一个交互式软件的操作,却不能看完程序教学视频后就直接写程 ...

  3. Galaxy Project | 生信人最值得学习的开源项目之一

    我与 Galaxy Project 的渊源可以追溯到我刚毕业,还在华大实习的那一段时间,这个项目应该是我职业生涯中最重要的一段经历.虽然这么对年以来一直都关注着这个项目,但大多数都是浅尝辄止,对源码层 ...

  4. 生信软件c语言,科学网—[转载]没有docker我真的不想动这样的生信软件 - 张成岗的博文...

    没有docker我真的不想动这样的生信软件 2020-03-26阅读 2620 C语言源代码需要编译的软件 最开始开发者都是C语言流派, 所以标准的源代码安装三部曲即可,即使 configure+ma ...

  5. 免费Linux系统和生信宝典原创学习教程

    生物信息的学习离不开Linux系统,不管自己写命令处理数据,还是使用现有的工具.Linux对我们来讲最重要的是它强大的命令行功能,可以快速.批量.灵活的处理数据的提取.统计和整理等耗时耗力的重复性工作 ...

  6. 生信宝典Linux学习系列文章整理

    欢迎关注天下博客:http://blog.genesino.com/2017/10/sxbd-linux-summary/ 生信宝典推出的Linux从入门到常用命令.软件安装方法.数据处理方法都在这了 ...

  7. 你想要的生物信息知识全在这——生信宝典文章目录

    培训 生物信息作图系列R.Cytoscape及图形排版和Python编程培训研讨班开课了 120分的转录组考题,你能得多少 维密摔倒不可怕,关键时有人搀一把,坚持走下去 生物信息作图系列 - R.网络 ...

  8. 易生信转录组培训第一期总结

    欢迎关注天下博客:http://blog.genesino.com/2017/11/transcriptome-training-summary/ 易生信九天的转录组分析培训班第一期伴随着5个小时的考 ...

  9. 易生信九天的转录组分析培训班总结

    易生信九天的转录组分析培训班第一期伴随着5个小时的考试在紧张中结束了.说是培训,倒不如研讨更确切些.在一个个问题的交流中学会转录组分析,效果远大于一人讲,自己练. 先分享两张现场的照片 前两天以集中讲 ...

最新文章

  1. 日常记录-Pandas Cookbook
  2. linux与linux的连接,linux 硬链接与软连接
  3. 【Android】动态UI : LayoutParams.addRule(...) LayoutParams.addRule(..., ...)
  4. 关于MSSQL数据存储的问题
  5. apache log4j_Apache log4j是领先的日志记录框架
  6. lambda的java_一分钟搞明白java8中的lambda
  7. IT行业里有这么多聪明人,他们之间的区别在哪里?
  8. BZOJ 3679 数位DP
  9. 《云周刊》69期:开门红利!阿里云2月活动来袭
  10. MFC 多字节和UNICODE的相互转换(解决中文utf8-ASCNII乱码问题)
  11. armv6、armv7、armv7s、armv8、armv64及其i386、x86_64区别
  12. mimics软件临床应用.计算机辅助外科入门技术,Mimics软件临床应用 计算机辅助外科入门技术.pdf...
  13. 漏洞复现永恒之蓝MS-17010+修复
  14. qt osg 多点触摸
  15. leetcode刷面试题(面试题08合集)
  16. Python:Flask简单实现统计网站访问量
  17. Hadoop集群之开启kerberos安全认证
  18. ABAP-SAP 账号批量创建分配权限程序
  19. 主成分分析时,如果矩阵秩亏,会发生什么后果?
  20. Java工程师核心书单,阿里大佬看了都说好!

热门文章

  1. 《Splunk智能运维实战》——1.8 定义字段提取内容
  2. visual studio——快速折叠所有代码和展开所有代码
  3. Redis源码、面试指南(5)多机数据库、复制、哨兵、集群
  4. SRE培训哪个培训机构好一些?
  5. Kaptcha 图片验证码使用
  6. 全局路径规划AstarDijkstra---ROS算法入门学习
  7. java tess4j mave_Java 验证码识别库 Tess4j 学习
  8. Ubuntu18.04网络图标不见了 火狐浏览器找不到服务器
  9. 全球及中国信息存储行业发展机遇与供需前景预测报告2022版
  10. 切点java_AspectJ之切点语法