火山图 多个样本、_statTarget-基于QC样本的代谢组学数据校正
导读
质量控制是基于质谱组学数据获得可重复性和准确性结果的必要步骤。重复使用相同的QC样本在MS run order序列中对信号漂移的评估和校正越来越被接受,尤其有利于提高批次间实验数据的质量,statTarget是一个流线型的工具,它为基于质量控制的信号校正、多批实验的MS数据集成以及基于MS的组学数据的综合统计分析提供了图形化的用户界面。本文档旨在指导用户使用函数执行数据分析,如shiftCor、statAnalysis、statTargetGUI函数等。
概述
statTarget
一个精简的可以提供图形用户界面,基于质QC样本进行信号校正,可以整合不同批次之间的代谢组学和蛋白质组学数据,并进行全面的统计分析。
statTarget是如何工作的
statTarget包括两方面内容
- 一个是信号校正(见后面的shiftCor函数)。其包括基于
QC
样本进行信号校正的集成学习方法。比如: 1) 基于QC样本的随机森林校正(QC-based random forest correction, QC-RFSC); 2) 基于QC样本的LOESS(locally weighted scatterplot smoothing)信号校正(QC-based LOESS signal correction, QCRLSC) - 第二部分内容是
统计分析
(详见后面介绍的statAnalysis函数)。提供了较为全面的用于分析组学数据的计算和统计方法,并且为生物标志物的发现提供多种结果。另外还提供了一个statTargetGUI功能,可以交互界面进行上述功能的操作。
statTarget包的功能列表
- 数据前处理(Data preprocessing):80%的原则,总丰度归一化(sum normalization),概率系数归一化(probabilistic quotient normalization),glog转化(glog transformation),K-近邻算法数据填充[3]、中位数、最小值填充都是针对缺失数据进行填充的方法。
- 数据描述:比如平均值、中位数、和、四分位数及标准差等
- 多元统计分析:如PCA, PLSDA, VIP, Random forest, Permutation-based feature selection。
- 单变量分析:Welch t检验,Shapiro-Wilk normality test(数据正态性检验) and Mann-Whitney test。
- 生物标记物分析:ROC, Odd ratio(优势比), P值多重校正,箱线图和火山图
statTargetGUI
因为该函数提供了一个交互式界面分析的功能
statTargetGUI
,所以先看下如何使用
## Examples Code for graphical user interface library(statTarget)statTargetGUI()#For mac PC, the GUI function 'statTargetGUI()' need the XQuartz instead of X11 support. Download it from https://www.xquartz.org. R 3.3.0 and RGtk2 2.20.31 are recommended for RGtk2 installation.
工作界面如下图所示
- 另外关于statTargetGUI的参考手册见官网[4]
信号校正
- 文件准备
Meta file
该文件包含样品名称,分组信息,批次和进样顺序。 1.Class:QC样品此处标为NA 2.Order:进样顺序 3.Batch:样本的批次信息 4.Meta文件和Profile文件的样品名称必须一致
Profile file
就是组学数据的丰度表
- 代码
## Examples Codelibrary(statTarget)datpath <- system.file('extdata',package = 'statTarget')
samPeno <- paste(datpath,'MTBLS79_sampleList.csv', sep='/')
samFile <- paste(datpath,'MTBLS79.csv', sep='/')
shiftCor(samPeno,samFile, Frule = 0.8, MLmethod = "QCRFSC", QCspan = 0,imputeM = "KNN")
- 该步运行的结果会得到校正后的文件以及图形展示
统计分析
- 文件准备
Stat File
该文件包含样品名称,分组(处理or未处理),丰度数据
- 代码
## Examples Code#library(statTarget)datpath <- system.file('extdata',package = 'statTarget')
file <- paste(datpath,'data_example.csv', sep='/')
statAnalysis(file,Frule = 0.8, normM = "NONE", imputeM = "KNN", glog = TRUE,scaling = "Pareto")
- 结果展示 包括PCA, PLS-DA, 火山图,随机森林等
处理质谱数据
- 另外还提供了XCMS,MZmine2,SIEVE和SKYLINE
- 下面以xcms处理后的数据为例
## Examples Codelibrary(statTarget)datpath <- system.file('extdata',package = 'statTarget')
dataXcms <- paste(datpath,'xcmsOutput.tsv', sep='/')
#dataSkyline <- paste(datpath,'skylineDemo.csv', sep='/')
transX(dataXcms,'xcms')
#transX(dataSkyline,'skyline')
- 处理后的数据也同上述数据分析步骤
参考
[1] Luan H., Ji F., Chen Y., Cai Z. (2018) statTarget: A streamlined tool for signal drift correction and interpretations of quantitative mass spectrometry-based omics data. Analytica Chimica Acta. dio: https://doi.org/10.1016/j.aca.2018.08.002
[2] Luan H., Ji F., Chen Y., Cai Z. (2018) Quality control-based signal drift correction and interpretations of metabolomics/proteomics data using random forest regression. bioRxiv 253583; doi: https://doi.org/10.1101/253583
[3] KNN,k-临近算法
[4] statTarget官网
火山图 多个样本、_statTarget-基于QC样本的代谢组学数据校正相关推荐
- statTarget-基于QC样本的代谢组学数据校正
为什么数据质量控制重要呢? 质量控制是生物分析的基本概念之一,用在保证组学测定的数据的重复性和精确性.由于色谱系统与质谱直接与样品接触, 随着分析样品的增多,色谱柱和质谱会逐步的污染,导致信号的漂移. ...
- linux生物代谢图软件,答疑解惑专题(四)——开源代谢组学全功能软件介绍
高通量代谢组学研究的一大难点在于数据处理和分析.对于质谱或核磁产生的海量数据需要借助于自动化的软件来进行数据分析.代谢组学全流程软件应具备完整的分析工作流程,包括数据预处理.物质鉴定.统计分析以及数据 ...
- 基于GC - MS的代谢组学研究揭示:SD大鼠和Wistar大鼠之间存在系统的代谢差异及乙醇灌胃反应差异
Author: Xianfu Gao,Aihua Zhao,Mingmei Zhou,Jingchao Lin,Yunping Qiu,Mingming Su,Wei Jia 写在前面: 大鼠被誉为精 ...
- 生物信息学|MOLI:基于深度神经网络进行多组学数据整合并用于药物反应预测
本篇推文引自:MOLI: multi-omics late integration with deep neural networks for drug response prediction 摘要 ...
- 百趣代谢组学文献分享 | 建立基于代谢组学的ICU脓毒症患者预后预测模型
文章标题:Identification of metabolomics-based prognostic prediction models for ICU septic patients 发表期刊: ...
- 基于单细胞多组学数据无监督构建基因调控网络
在单细胞分辨率下识别基因调控网络(GRNs,gene regulatory networks)一直是一个巨大的挑战,而单细胞多组学数据的出现为构建GRNs提供了机会. 来自:Unsupervised ...
- cytoscape使用方法_7种方法 ,订制你的专属venn图!-代谢组学/蛋白组学研究
维恩图(Venn diagram),或译Venn图.文氏图.温氏图.范氏图,是用以表示集合(或类)的一种图. 大家对这种图应该不陌生,他们长这样: 或是这样: 以及,这~~样~~~~ 在数据可视化图片 ...
- 代谢组学结果在线分析:不同组差异代谢物高级韦恩图Venn的绘制——UpSet图
文章目录 什么是UpSet图? UpSet图在线分析网站 数据准备 生成结果图与调整 什么是UpSet图? 可以说是Venn图的变体,对于集合数据的可视化,适用于少量组别的数据集,一般用于转录组数据基 ...
- 关于QC样本的制备与分析
在做代谢组学分析的时候,经常会听到QC,QC是样本检测过程中必不可少的一部分,可用于考察方法的稳定性和重复性,今天给大家分享一篇QC的科普贴.如有疑问和不足,欢迎留言 QC样本的制备: 混合相同体积的 ...
最新文章
- 修改所有列_多人编辑,自动汇总,领导可见所有?用 SeaTable 表格更简单
- hostapd中扫描的调用过程
- Python分支结构你真的搞定了吗?
- 22-React JSX语法
- 学习笔记(28):Python网络编程并发编程-死锁与递归锁
- [html] 浏览器是怎么对HTML5的离线储存资源进行管理和加载的
- 实验8 SQLite数据库操作
- ajax mysql登录我注册_ajax方式实现注册功能(提交数据到后台数据库完成交互)
- react-native踩坑的开始!
- mysql blob字段存储_使用数据库Blob数据类型进行对象临时存储
- 【Elasticsearch】elasticsearch 段 segment 段合并
- 机器学习算法工程师的经典面试问题
- 如何学习多传感器感知融合技术?
- 花了三个月终于把所有的 Python 库全部整理了!可以说很全面了
- AD库:如何从立创商城得到自己想要的库
- 小米6线刷包php文件格式,小米6官方固件刷机教程_线刷|救砖教程图解
- Google OKR 目标管理体系学习
- Word中无法插入公式的解决方案
- 23种设计模式之策略模式——小鸭子的故事
- ZOJ Problem Set - 4043 Virtual Singers(2018acm 青岛赛区热身赛)
热门文章
- 用递归解决冒泡排序问题
- OpenCV-高斯滤波cv::GaussianBlur
- Github-初始化仓库
- 计算机国家实验教学示范中心,教育部 财政部关于批准2007年国家级实验教学示范中心建设...
- mysql like 大小写_mysql - 如何使用LIKE通配符在列中搜索(不区分大小写)?
- linux守护进程写法_搞懂进程组、会话、控制终端关系,才能明白守护进程如何创建...
- python123电脑登录不了_python(14)- 简单练习:登录账户失败三次,账户自动锁定...
- 黄金三月,技术自检 | 作为测试人必备的10项 Linux 技能
- python sftp连接_Python 脚本:创建SFTP连接传输数据
- so(3) se(3) optimization