欢迎关注”生信修炼手册”!

转录调控是一种重要的调控机制,转录因子对基因的表达调控是其中研究的最广泛的一个领域。研究转录因子,最经典的数据库就是TRANFAC数据库,网址如下

http://gene-regulation.com/

该数据库中不仅收录了转录因子和对应的家族信息,也收录了转录因子调控的基因以及转录因子结合位点TFBS等信息。该数据库有以下两个版本

  1. Professional

  2. Public

两个版本的比较如下

public版本是免费开工的,但是收录的数据少很多,而且2005年之后就不在更新了。Professional数据多,功能强大,但是收费的。

虽然两个版本数据量不同,但是数据的组织和展示形式是一样的,可以通过Public来了解下其中的信息,使用public数据库是需要登录的,登录之后,可以看到如下的检索页面

public版本中,将转录因子相关信息进行了分类整体,共分成以下6种类型

  • Factor

  • Class

  • Matrix

  • Site

  • Cell

  • Gene

1. Factor

Facto 代表转录因子,每个转录因子的编号以T开头,通过如下方式可以检索到所有转录因子的信息

共收录了73840个转录因子的信息,以转录因子T00002为例,结果如下

几个重要标签的含义如下

  1. AC代表转录因子编号,以大写字母T开头

  2. FA代表转录因子的名字factor name

  3. SY代表转录因子的别名;

  4. OS代表对应的物种

  5. OC代表物种分类信息

  6. GE代表编码该转录因子的基因

  7. CL代表该转录因子所属的分类

  8. SZ代表氨基酸长度,分子量

  9. SQ代表对应的氨基酸序列

2. Class

转录因子是一种具有调控功能的蛋白质,和蛋白质家族类似,也有转录因子家族的概念,class 代表的就是转录因子家族信息,每个转录因子家族的编号以C开头,通过如下方式可以检索到所有转录因子家族信息

共收录了292个转录因子家族,以C0001为例,结果如下

几个重要标签的含义如下

  1. AC代表转录因子家族编号,以大写字母C开头

  2. ID代表转录因子家族的class code

  3. BF代表属于该家族的转录因子

3.  Matrix

转录因子和序列的结合区包含了一个保守的motif,motif代表的是一种碱基模式,代表的是多种碱基序列,示意如下

同一个转录因子,其结合的区域序列尽管不完全一致,但是还是有很多共同的地方,上述13个序列可以用以下序列表示


上述这种写法就可以看做是一个motif,  但是只有序列信息,描述并不够完整,所以提出了一个想法,就是加上对应的原始的13种序列中的碱基分布,示意如下

上述的碱基频数分布矩阵就称之为Position Freuquency Matirx, 简称PFM, 也就是这里的Matrix信息。每个Matrix的编号以M开头,通过如下方式可以检索到所有信息

共收录了2328个PFM信息,以M00001为例,结果如下

几个重要标签的含义如下

  1. AC代表PFM编号,以大写字母M开头

  2. NA代表对应的转录因子的名字

  3. DE代表对应的转录因子的描述信息

  4. BF代表对应的转录因子的链接

  5. PO代表碱基频数分布

4. Sites

Sites代表转录因子结合区域的信息,每个结合区域的编号以R开头,通过如下方式可以检索到所有信息

共收录了68408个结合区域信息,以R0002为例,结果如下

几个重要标签的含义如下

  1. AC代表结合区域的编号,以大写字母R开头

  2. ID以物种开头,HS代表human

  3. DE代表对应的基因的描述和编号

  4. SQ代表结合区域的序列

  5. SF代表结合区域的起始位置,因为位于基因上游,所以是负数

  6. ST代表结合区域的终止位置,因为位于基因上游,所以是负数

  7. BF代表对应的转录因子的链接

5. Gene

Gene代表的就是基因信息,每个基因的编号以G开头,通过如下方式可以检索到所有基因的信息

共收录了10653个基因,以基因G000001为例,结果如下

几个重要标签的含义如下

  1. AC代表基因的编号,以大写字母G开头

  2. ID以物种加基因名字构成

  3. SD代表基因的名字

  4. BS代表该基因相关的转录因子结合区域信息以及对应的转录因子编号

6. cell

转录因子结合区域的信息是根据某个细胞系的数据计算得到的,cell代笔的就是细胞系的数据表,编号是纯数字的,通过如下方式可以检索到所有信息

共收录了1476个细胞系的信息,以0007为例,结果如下

几个重要标签的含义如下

  1. AC代表细胞系的编号

  2. OS代表物种

  3. CD代表细胞系的描述信息

  4. BS代表在该细胞系的数据中鉴定到的转录因子结合区域信息

由于public数据库不开放下载功能,我们只能利用该数据库进行检索。想要更多功能,只能购买Professional版。

·end·

—如果喜欢,快分享给你的朋友们吧—

扫描关注微信号,更多精彩内容等着你!

TRANSFAC:转录因子及其靶基因数据库相关推荐

  1. miRNA数据库篇——miRDB:软件预测的哺乳动物miRNA靶基因数据库(假阳性较高)

    miRDB:软件预测的哺乳动物miRNA靶基因数据库 miRDB通过MirTarget这个软件预测了人,小鼠等多个物种的miRNA靶基因信息,并将其整理成了数据库,网址如下 http://www.mi ...

  2. miRNA数据库篇——TargetScan:哺乳动物miRNA靶基因数据库

    TargetScan:哺乳动物miRNA靶基因数据库 哺乳动物中的miRNA通过结合转录本序列的3'UTR区,从而发挥转录后调控作用.TargetScan是一个专门分析哺乳动物miRNA靶基因的软件, ...

  3. miRNA数据库篇——miRTarBase:实验验证的miRNA靶基因数据库

    miRTarBase:实验验证的miRNA靶基因数据库 简介 miRTarBase是一个手工收集的,经过实验验证过的miRNA靶基因数据库(MTI, MicroRNA-Target Interacti ...

  4. miRNA数据库篇——miRWalk:综合型的miRNA靶基因数据库

    miRWalk:综合型的miRNA靶基因数据库 miRWalk是一个综合性的miRNA靶基因数据库,收录了人,小鼠等多个物种的miRNA靶基因信息,和mirDIP类似,也是一个整合型数据库,整合了来自 ...

  5. miRNA数据库篇——mirDIP:最全面的人类miRNA靶基因数据库

    mirDIP:最全面的人类miRNA靶基因数据库 mirDIP集成了30个来源数据库中human相关的靶基因信息,网址如下: http://ophid.utoronto.ca/mirDIP/index ...

  6. 生信宝典之傻瓜式(六)查找转录因子的靶基因

    请关注天下博客:http://blog.genesino.com/2018/04/cistrome/ 傻瓜系列教程断断续续出了5篇了,依次为: 生信宝典之傻瓜式 (一) 如何提取指定位置的基因组序列 ...

  7. TargetScan:哺乳动物miRNA靶基因数据库

    欢迎关注"生信修炼手册"! 哺乳动物中的miRNA通过结合转录本序列的3'UTR区,从而发挥转录后调控作用.TargetScan是一个专门分析哺乳动物miRNA靶基因的软件,并且根 ...

  8. mysql的genelog_小白实战课堂!转录因子的候选靶基因查询~~

    原标题:小白实战课堂!转录因子的候选靶基因查询-- 一文学会Harmonizonme和hTFtarget数据库使用方法 嗨,小伙伴们大家好!这里是每周一弘毅专栏,我志向用小小文字助力你的SCI发表之路 ...

  9. DAP-seq技术鉴定全基因组水平上的ZjVND7靶基因,揭示酸枣全基因组复制在调节木质部导管分化和耐旱性中的作用

    全基因组复制对生物体的影响是多方面的.全基因组加倍后,基因剂量效应.修饰的互作调控.快速遗传和表观遗传的修饰和变化,都会对基因组产生强烈影响,进而影响基因表达,最终导致形态.生理和适应性等性状方面的差 ...

最新文章

  1. 重载自增++和自减--运算符
  2. 需要将git分支重置为原始版本
  3. Android中WebView加载sdcard中的html时提示:ERR_FILE_NOT_FOUND和ERR_ACCESS_DENIED
  4. Java - 用数组求出斐波那契数列的前20项值
  5. 使用 Pandas 的 to_excel() 方法来将多个 csv 文件合并到一个 xlsx 的不同 sheets 内
  6. carla安装之clang版本问题
  7. python简明教程_04
  8. M2Det 论文笔记
  9. VScode如何在浏览器中打开html文件
  10. data.unity3d 文件过大解决方法
  11. python自动排版_你熟悉Python的代码规范吗?如何一键实现代码排版
  12. odi连接oracle数据库,通过ODI接口把数据从Oracle数据库抽到HIVE数据库怎么解决
  13. A1008 Elevator (20 分)
  14. ICLOUD储存空间要升级吗_苹果iCloud照片恢复步骤
  15. 统治地球的冯·诺依曼
  16. excel文件需要双击两次才能打开,解决方案
  17. IDEA waiting until last debugger command completes
  18. 新浪财经隆重推出四大千万级财经博客
  19. 99行C++代码实现光线追踪-算法
  20. 人大金仓数据库安装kingbase

热门文章

  1. Win32_5程序员求爱的创意程序^_^
  2. c语言输出手机号是负的是怎么回事,找出正确手机号码
  3. 山东建筑大学PHP期末考试题,山东建筑大学数据库期末考试4答案
  4. 短视频,是信息的终极形态:如何抓住比特红短视频这个红利?
  5. win10IE浏览器打不开怎么办
  6. python——异常except语句用法与引发异常 (摘抄)
  7. 全局安装nuxt_Nuxt项目搭建到Nuxt项目部署
  8. iCheck基本用法的使用
  9. python打印表格_Python 表格打印
  10. 想不想修真鸿蒙之礼奖励,想不想修真感恩之礼奖励有什么 想不想修真感恩之礼奖励内容一览...