可以将Trinity.fasta最长转录本作为unigenes,也可以使用其他软件,如GTICL和cd-hit。一般GTICL和cd-hit得到的unigenes比Trinity软件得到的数量要多,有人指出在GTICL和cd-hit的结果中能找到自己想要的基因,而在最长库中有的难以找到。

 1. 安装

Cd-hit下载网址为https://github.com/weizhongli/cdhit。
解压后直接输入命令:make,进行编译即可。
2. 运行
Cd-hit的输入文件仅有一个fasta文件,可将几个样品的基因或蛋白序列汇总进行聚类,如:cat a.fasta b.fasta c.fasta > all.fasta。注意各样品的序列名称不能重复。
 
$ cd-hit-est -i in.fasta -o out.fasta -n 8 -d 0 -M 100000 - T 48
cd-hit-est: 核酸聚类
-M: 内存,单位M
-T: CPU线程数
-c: threshold,默认为0.9
-d: 命名符号长度,默认20,0则为>原序列名
 Choose of word size:
-n 10, 11 for thresholds 0.95 ~ 1.0
-n 8,9 for thresholds 0.90 ~ 0.95
-n 7 for thresholds 0.88 ~ 0.9
-n 6 for thresholds 0.85 ~ 0.88
-n 5 for thresholds 0.80 ~ 0.85
-n 4 for thresholds 0.75 ~ 0.8
 

转载于:https://www.cnblogs.com/shawn2018/p/8336191.html

cd-hit 转录本聚类相关推荐

  1. Syllable-Based Acoustic Modeling with CTC-SMBR-LSTM翻译

    摘要 我们探讨了用音节而不是音素作为输出来训练长期短期记忆(LSTM)循环神经网络(RNN)的可行性.音节是建模自然语言(例如普通话)声学模型语言单位的一种自然选择,这是因为音节作为基本发音结构的固有 ...

  2. 微生物组—宏基因组分析专题培训开课啦!10月北京

    在广大粉丝的期待下,<生信宝典>联合<宏基因组>在2018年10月19-21日,北京鼓楼推出<宏基因组分析专题培训>专题培训第二期,为大家提供一条走进生信大门的捷径 ...

  3. linux下自动补全问题: autocomplete sh: ( compgen -d — ” ): No such file or directory

    autocomplete sh: <( compgen -d - " ): No such file or directory http://www.dansketcher.com/2 ...

  4. 机器学习常见面试题总结

    序号 题目 难度 A B C D E F 正确答案 1 关于 Logit 回归和 SVM 不正确的是 简单 Logit 回归目标函数是最小化后验概率 Logit 回归可以用于预测事件发生概率的大小 S ...

  5. 掌握三代全长转录组测序,看这一篇就够了!

    "三代转录组"是什么?对于混迹在科研领域的一员,如果现在还不了解全长转录组测序,恐怕都不好意思说自己了解高通量测序了呢! 今天小编总结了一些三代全长转录组测序的相关问题,给大家来一 ...

  6. gff文件_GTF与GFF文件所有操作尽在这里

    一.格式介绍 (一)gtf文件.GTF 为General Transfer Format缩写,跟 GFF2格式类似.相信大家做转录组分析时候经常会看到Cufflinks或者Stringtie软件对转录 ...

  7. python 密度聚类 使用_使用wgd进行全基因组复制分析

    因为全基因组复制(Whole genome duplications, WGD)是生物进化的重要因素之一, 所以WGD分析也是基因组分析经常用到的一种分析方法.举个例子,我们之所以能在多条染色体之间发 ...

  8. Udacity机器人软件工程师课程笔记(二十一) - 对点云进行集群可视化 - 聚类的分割 - K-means|K均值聚类, DBSCAN算法

    聚类的分割 1.K-均值聚类 (1)K-均值聚类介绍 k均值聚类算法(k-means clustering algorithm)是一种迭代求解的聚类分析算法,其步骤是随机选取K个对象作为初始的聚类中心 ...

  9. QIIME 2教程. 19使用q2-vsearch聚类ASVs为OTUs(2021.2)

    使用q2-vsearch聚类序列为OTUs Clustering sequences into OTUs using q2-vsearch 目前QIIME2支持三个聚类方式:无参(De novo), ...

最新文章

  1. java 抓屏_java抓屏代码
  2. 2月15日Python线上峰会免费学!6场精华分享,用代码“抗”疫
  3. Spring 定时器
  4. asp.net小技巧:摆脱路径的困扰(三)
  5. 新站上线后应该做哪些有利于seo的工作
  6. 本地存储与云存储方案价值对比—Vecloud
  7. 微习惯虽好,但是最重要的还是坚持
  8. 微信授权 php josn,php怎么获取微信多客服json数据
  9. 【jQuery学习】—实现弹幕效果
  10. Ubuntu20.04安装ROS Noetic
  11. 人工智能语言python招聘_编程语言这么多为什么选Python
  12. Unity3D学习 ④ Unity导入商店资源,实现基本的奔跑、攻击动作切换与交互
  13. NLTK文本分割器是如何工作的
  14. 如何截取网易云音乐的歌曲
  15. 计算机动画制作有什么软件,电脑绘画和动画制作,要用什么软件?
  16. 【Word】docx转doc后公式转换为图片不清晰/模糊
  17. Mysql 中 “必知” 的单行处理函数
  18. 恋词题源报刊Unit2
  19. Java for Web学习笔记(三五):自定义tag(3)TLDS和Tag Handler
  20. 智能家居水传感器行业调研报告 - 市场现状分析与发展前景预测

热门文章

  1. Oracle表的分区update卡着,分区表分区字段的update操作
  2. 第130篇 在 OpenSea 上创建自己的 NFT 商店(2)
  3. Ambari自定义服务
  4. 蓝海创意云接受【看苏州】独家专访:助力苏州数字文化行业全方位发展
  5. 第17章 关于局部波动率的一些总结
  6. BVT测试(版本验证测试、冒烟测试)和Daily build
  7. 丙申猴年,新春快乐!
  8. 转载:C# IO读取文件问题:正由另一进程使用
  9. flash上制作一个按钮,控制动画播放、暂停
  10. 图片查看器viewer