使用 MEME 分析不同类型的 NB-ARC 结构域中 Motif 的差异
NBS-LRR 基因家族是一种常见的抗病基因家族,该基因家族在所有抗病基因中占比超过 60%。一般被子植物的基因组中包含数百个 NBS-LRR 基因家族的基因。
NBS-LRR 基因家族编码的蛋白可以分成 3 个结构域,TIR/CC/RPW8 + NBS + LRR,根据蛋白 N 端的结构域可以将 NBS-LRR 分为三类:T (TIR) NL、C (CC) NL 和 R (RPW8) NL。
本文通过使用 MEME 工具包来分析 TNL、CNL、RNL 三类蛋白中 NBS 结构域的差异。数据集为从 www.rosaceae.org 数据库网站上下载的 19 种蔷薇科植物的蛋白质 fasta 文件。方法主要参考文献《Genome- Wide Analysis of the Nucleotide Binding Site Leucine-Rich Repeat Genes of Four Orchids Revealed Extremely Low Numbers of Disease Resistance Genes》,Front. Genet.,08 January 2020。
PS:有关 MEME 工具包的介绍详见 MEME 使用简介 。
一、使用 MEME 分析蛋白质序列
- 使用 Hmmer 筛选出 19 种蔷薇科植物中包含 NB-ARC 结构域的蛋白。具体过程参见 使用 Blastp 和 Hmmer 筛选出包含特定结构域的蛋白。
- 将筛选出的蛋白序列提交至 NCBI 的 CD-Search 分析,确定筛选出的蛋白所包含的全部结构域。
- 根据 CD-Search 的结果筛选出同时包含 TIR + NB-ARC、RX-CC + NB-ARC、RPW8 + NB-ARC 结构域的蛋白,并分类提取出三类蛋白的 NB-ARC 结构域的氨基酸序列信息。
- 对提取出的 NB-ARC 结构域进行过滤,以 [75% mean-length,125% mean-length] 作为过滤标准,其中为 mean-length 为各类 NB-ARC 结构域的平均长度。
- 将长度较为统一的 NB-ARC 序列作为输入用 MEME 进行分析。在线观看 Motif Logo 的同时下载结果(MEME HTML output >> Submit/Download >> Download Motif >> FASTA 或 Raw)。
注意! 面对大批量序列的 Motif 分析本应当使用 STREME,而非 MEME。但 STREME 的输出结果不包含 Motif 在每个蛋白中的具体序列信息,故这里使用 MEME。
- 将 MEME 挖掘到的 Motif 与参考文献中的 Motif 比较,挖到了 P-loop、Kinase-2、Kinase-3、RNBS-C 和 GLPL 五个 Motif,没有挖到 RNBS-D Motif。
注意! 在没有参考文献进行比较的情况下,可以通过 Tomtom 将 Motif 与已知 Motif 进行比对,预测 Motif 的功能。
- 观察 MEME 的 Motif Logo 发现,各类 NB-ARC 中挖掘到的包含相同核心氨基酸的 Motif 长短不一,并且核心氨基酸在 Motif 中的位置也不固定。下面三幅 Motif Logo 分别是 RX-CC、TIR、RPW8 的 P-loop Logo。Motif 的长度分别为 21、21、29,GKTT 氨基酸分别处在 Motif 的 10、9、13 位点。Motif 长度不一及核心氨基酸位置的偏移给 Motif 间的比较带来了困难。所以这里我以核心氨基酸为中心,上下游截取相同数量的氨基酸,提取出 Motif 在各类蛋白中的序列信息。如 P-loop 以 GKTT 为核心氨基酸,上游取 8 个氨基酸,下游取 2 个氨基酸。
二、使用 WebLogo 绘制 Motif Logo
WebLogo 提供绘制 Motif Logo 的功能,输入文件为 固定长度的 Motif 序列。将上述步骤提取出来的 Motif 作为 WebLogo 的输入,结果如下,分别为 RX-CC、TIR、RPW8。
使用 MEME 分析不同类型的 NB-ARC 结构域中 Motif 的差异相关推荐
- 【供应链】全面分析供应链类型
全面分析供应链类型 依据不同的划分规范,可以将供应链分为以下几品种型: 按"规模"分 内部供应链:是指企业内部产品出产和流转进程中所触及的收购.出产.仓储.销售等部分组成的供需网络 ...
- [循证理论与实践] meta分析系列之一: meta分析的类型
证据是循证医学( Evidence-based medcine,EBM) 的核心,基于随机对照试验( RCT) 的系统评价/meta分析是当前 公认的最高级别证据. meta分析在医学领域应用最为广泛 ...
- 【Mybatis】Mybatis将String类型的0存到数据库中的number类型字段中,变成了空;
一.问题 Mybatis将String类型的0存到数据库中的number类型字段中,变成了空: 二.分析 自己写了一个自动写代码的脚本,带入springBatch后,读取文件时,少了序列号0-9的记录 ...
- 创建会计科目(FSP0/FS00)报错“损益报表科目类型在科目表 ZT01 中未定义”
文章目录 一.问题再现及初步分析 二.解决方法和实操验证 2.1 解决方法 2.2 实操验证 一.问题再现及初步分析 Step1.定义公司代码 Step2.定义会计科目表 Step3.给科目表分配公司 ...
- 漏洞分析与检测技术在物联网安全中的应用
这里写自定义目录标题 一.引言 二.相关理论 1.物联网系统安全挑战 1.1 网络层安全挑战 1.2 硬件感知层安全挑战 1.3 中间件层安全挑战 1.4 应用功能层安全挑战 2.漏洞挖掘技术 三.漏 ...
- Python使用matplotlib可视化相关性分析热力图图heatmap、使用seaborn中的heatmap函数可视化相关性热力图(Correllogram)
Python使用matplotlib可视化相关性分析热力图图heatmap.使用seaborn中的heatmap函数可视化相关性热力图(Correllogram) 目录
- var和dynamic的应用 var、动态类型 dynamic 深入浅析C#中的var和dynamic ----demo
using System; using System.Collections.Generic; using System.Linq; using System.Text; using System.T ...
- java引用类型和值类型_[Java教程]JavaScript中值类型和引用类型的区别
[Java教程]JavaScript中值类型和引用类型的区别 0 2017-02-24 00:00:35 JavaScript的数据类型分为两类:原始类型和对象类型.其中,原始类型包括:数字.字符串和 ...
- 转:SqlServer中的datetime类型的空值和c#中的DateTime的空值的研究
SqlServer中的datetime类型的空值和c#中的DateTime的空值的研究 在SqlServer 2000中datetime 的空值即默认值为1900-01-01 00:00 :00,C# ...
最新文章
- 校招经验分享—高考结束!校招还会远么~~
- React Router 使用教程
- sql远程mysql服务器查询_sql server 使用链接服务器远程查询
- ExtJs6 理解 -- Ext.data.proxy.Proxy
- vs2005添加live555工程
- 男孩684分被清华预录取, 他的故事感动中国
- java项目 导出_Java项目的导入和导出
- Kali Linux下的软件安装
- OpenGL进阶演示样例1——动态画线(虚线、实线、颜色、速度等)
- 新一代华为折叠屏手机MateX2,你会考虑入手吗?
- 使用WCF实现消息推送
- 哈工大-基于内核栈切换的进程切换
- Facebook开发实时分析控制面板
- python工程师工资多少-Python全栈工程师为何这么火薪资这么高看了才知道
- 项目开发文档编写规范【附文档模板】
- JAVA练习题---银行账户管理系统
- CSS设置字体为微软雅黑 且 解决用户设备上没有该字体的问题
- APP内跳转QQ和陌生人聊天实现客服功能
- MySQL -> DML:删除(delete),(truncate table)
- 定理在数学中的简写形式_高中数学联赛常用定理