NBS-LRR 基因家族是一种常见的抗病基因家族,该基因家族在所有抗病基因中占比超过 60%。一般被子植物的基因组中包含数百个 NBS-LRR 基因家族的基因。

NBS-LRR 基因家族编码的蛋白可以分成 3 个结构域,TIR/CC/RPW8 + NBS + LRR,根据蛋白 N 端的结构域可以将 NBS-LRR 分为三类:T (TIR) NL、C (CC) NL 和 R (RPW8) NL。

本文通过使用 MEME 工具包来分析 TNL、CNL、RNL 三类蛋白中 NBS 结构域的差异。数据集为从 www.rosaceae.org 数据库网站上下载的 19 种蔷薇科植物的蛋白质 fasta 文件。方法主要参考文献《Genome- Wide Analysis of the Nucleotide Binding Site Leucine-Rich Repeat Genes of Four Orchids Revealed Extremely Low Numbers of Disease Resistance Genes》,Front. Genet.,08 January 2020。

PS:有关 MEME 工具包的介绍详见 MEME 使用简介 。

一、使用 MEME 分析蛋白质序列

  1. 使用 Hmmer 筛选出 19 种蔷薇科植物中包含 NB-ARC 结构域的蛋白。具体过程参见 使用 Blastp 和 Hmmer 筛选出包含特定结构域的蛋白。
  2. 将筛选出的蛋白序列提交至 NCBI 的 CD-Search 分析,确定筛选出的蛋白所包含的全部结构域。
  3. 根据 CD-Search 的结果筛选出同时包含 TIR + NB-ARC、RX-CC + NB-ARC、RPW8 + NB-ARC 结构域的蛋白,并分类提取出三类蛋白的 NB-ARC 结构域的氨基酸序列信息。
  4. 对提取出的 NB-ARC 结构域进行过滤,以 [75% mean-length,125% mean-length] 作为过滤标准,其中为 mean-length 为各类 NB-ARC 结构域的平均长度。
  5. 将长度较为统一的 NB-ARC 序列作为输入用 MEME 进行分析。在线观看 Motif Logo 的同时下载结果(MEME HTML output >> Submit/Download >> Download Motif >> FASTA 或 Raw)。

    注意! 面对大批量序列的 Motif 分析本应当使用 STREME,而非 MEME。但 STREME 的输出结果不包含 Motif 在每个蛋白中的具体序列信息,故这里使用 MEME。

  6. 将 MEME 挖掘到的 Motif 与参考文献中的 Motif 比较,挖到了 P-loop、Kinase-2、Kinase-3、RNBS-C 和 GLPL 五个 Motif,没有挖到 RNBS-D Motif。

    注意! 在没有参考文献进行比较的情况下,可以通过 Tomtom 将 Motif 与已知 Motif 进行比对,预测 Motif 的功能。

  7. 观察 MEME 的 Motif Logo 发现,各类 NB-ARC 中挖掘到的包含相同核心氨基酸的 Motif 长短不一,并且核心氨基酸在 Motif 中的位置也不固定。下面三幅 Motif Logo 分别是 RX-CC、TIR、RPW8 的 P-loop Logo。Motif 的长度分别为 21、21、29,GKTT 氨基酸分别处在 Motif 的 10、9、13 位点。Motif 长度不一及核心氨基酸位置的偏移给 Motif 间的比较带来了困难。所以这里我以核心氨基酸为中心,上下游截取相同数量的氨基酸,提取出 Motif 在各类蛋白中的序列信息。如 P-loop 以 GKTT 为核心氨基酸,上游取 8 个氨基酸,下游取 2 个氨基酸。



二、使用 WebLogo 绘制 Motif Logo

WebLogo 提供绘制 Motif Logo 的功能,输入文件为 固定长度的 Motif 序列。将上述步骤提取出来的 Motif 作为 WebLogo 的输入,结果如下,分别为 RX-CC、TIR、RPW8。

使用 MEME 分析不同类型的 NB-ARC 结构域中 Motif 的差异相关推荐

  1. 【供应链】全面分析供应链类型

    全面分析供应链类型 依据不同的划分规范,可以将供应链分为以下几品种型: 按"规模"分 内部供应链:是指企业内部产品出产和流转进程中所触及的收购.出产.仓储.销售等部分组成的供需网络 ...

  2. [循证理论与实践] meta分析系列之一: meta分析的类型

    证据是循证医学( Evidence-based medcine,EBM) 的核心,基于随机对照试验( RCT) 的系统评价/meta分析是当前 公认的最高级别证据. meta分析在医学领域应用最为广泛 ...

  3. 【Mybatis】Mybatis将String类型的0存到数据库中的number类型字段中,变成了空;

    一.问题 Mybatis将String类型的0存到数据库中的number类型字段中,变成了空: 二.分析 自己写了一个自动写代码的脚本,带入springBatch后,读取文件时,少了序列号0-9的记录 ...

  4. 创建会计科目(FSP0/FS00)报错“损益报表科目类型在科目表 ZT01 中未定义”

    文章目录 一.问题再现及初步分析 二.解决方法和实操验证 2.1 解决方法 2.2 实操验证 一.问题再现及初步分析 Step1.定义公司代码 Step2.定义会计科目表 Step3.给科目表分配公司 ...

  5. 漏洞分析与检测技术在物联网安全中的应用

    这里写自定义目录标题 一.引言 二.相关理论 1.物联网系统安全挑战 1.1 网络层安全挑战 1.2 硬件感知层安全挑战 1.3 中间件层安全挑战 1.4 应用功能层安全挑战 2.漏洞挖掘技术 三.漏 ...

  6. Python使用matplotlib可视化相关性分析热力图图heatmap、使用seaborn中的heatmap函数可视化相关性热力图(Correllogram)

    Python使用matplotlib可视化相关性分析热力图图heatmap.使用seaborn中的heatmap函数可视化相关性热力图(Correllogram) 目录

  7. var和dynamic的应用 var、动态类型 dynamic 深入浅析C#中的var和dynamic ----demo

    using System; using System.Collections.Generic; using System.Linq; using System.Text; using System.T ...

  8. java引用类型和值类型_[Java教程]JavaScript中值类型和引用类型的区别

    [Java教程]JavaScript中值类型和引用类型的区别 0 2017-02-24 00:00:35 JavaScript的数据类型分为两类:原始类型和对象类型.其中,原始类型包括:数字.字符串和 ...

  9. 转:SqlServer中的datetime类型的空值和c#中的DateTime的空值的研究

    SqlServer中的datetime类型的空值和c#中的DateTime的空值的研究 在SqlServer 2000中datetime 的空值即默认值为1900-01-01 00:00 :00,C# ...

最新文章

  1. 校招经验分享—高考结束!校招还会远么~~
  2. React Router 使用教程
  3. sql远程mysql服务器查询_sql server 使用链接服务器远程查询
  4. ExtJs6 理解 -- Ext.data.proxy.Proxy
  5. vs2005添加live555工程
  6. 男孩684分被清华预录取, 他的故事感动中国
  7. java项目 导出_Java项目的导入和导出
  8. Kali Linux下的软件安装
  9. OpenGL进阶演示样例1——动态画线(虚线、实线、颜色、速度等)
  10. 新一代华为折叠屏手机MateX2,你会考虑入手吗?
  11. 使用WCF实现消息推送
  12. 哈工大-基于内核栈切换的进程切换
  13. Facebook开发实时分析控制面板
  14. python工程师工资多少-Python全栈工程师为何这么火薪资这么高看了才知道
  15. 项目开发文档编写规范【附文档模板】
  16. JAVA练习题---银行账户管理系统
  17. CSS设置字体为微软雅黑 且 解决用户设备上没有该字体的问题
  18. APP内跳转QQ和陌生人聊天实现客服功能
  19. MySQL -> DML:删除(delete),(truncate table)
  20. 定理在数学中的简写形式_高中数学联赛常用定理

热门文章

  1. tx2 1804 soure list
  2. 专有云ABC Stack,真正的实力派!
  3. 为什么别的程序员天天吃鸡,你却顿顿吃土?
  4. 电子计算机X光机,X线机
  5. 元器件的非线性与线性
  6. HeyUI组件库12月更新日志:Clipboard复制剪切板,Avatar头像
  7. Java类和对象(一)
  8. 小学教师计算机培训课程感言,小学教师信息技术培训的心得体会
  9. 双十一适合买的助眠好物,改善失眠更快入睡
  10. Verilog编程艺术(3)——第四部分 高级设计