Pacbio数据相信大家都不陌生了,reads很长,但是错误很多而且错误分布在整条reads上而不是局部。这里给大家推荐一个工具BLASR(Basic Local Alignment with Successive Refinement )。BLASR可以讲pacbio的reads比对到比较剪辑错误比较少的序列上,譬如组装出来的contig等。

关于BLASR的算法以及相关的信息,可以参考其原文:We describe the method BLASR (Basic Local Alignment with Successive Refinement) for mapping Single Molecule Sequencing (SMS) reads that are thousands to tens of thousands of bases long with divergence between the read and genome dominated by insertion and deletion error. We also present a combinatorial model of sequencing error that motivates why our approach is effective. The results indicate that mapping SMS reads is both highly specific and rapid.

关于安装:

BLASR的安装很简单,但是必须先安装hdf5 libraries。

使用:

这里利用BLASR把pacbio reads 比对到组装好的contig(target.fasta)上去。target.fasta.sa是target.fasta通过sawriter产生的suffix array。blasr query.fa ./target.fasta -sa ./target.fasta.sa -bestn 40 -maxScore -500 -m 4 -nproc 24 -out target.m4 -maxLCPLength 15

在24核、48G内存的服务器上,将3G的pacbio reads比对到1000,000条contig(平均长度3500bp)上,大约需要3小时。

另外分享这篇论文里面比较有意思的一张图片:

图例:Figure 1 An illustration of relationships between alignment methods.

The applications / corresponding computational restrictions shown are (green) short pairwise alignment / detailed edit model; (yellow) database search / divergent homology detection; (red) whole genome alignment / alignment of long sequences with structural rearrangements; and (blue) short read mapping / rapid alignment of massive numbers of short sequences. Although solely illustrative, methods with more similar data structures or algorithmic approaches are on closer branches. The BLASR method combines data structures from short read alignment with optimization methods from whole genome alignment

asr标注工具_BLASR:PacBio数据比对工具相关推荐

  1. asr标注工具_【AI模型测试】语音识别ASR的结果校对

    语音转文字(ASR)识别完毕后,目前对于各家的结果都是纯手工的计算,标注错别字和漏识字,感觉到很费时费力,少量的还可以,大量的就有点太费劲了. 所以,为了解放自己的劳动力,让代码帮忙做更多的事情,所以 ...

  2. ZoomIt – 屏幕标注、电子画笔 [小工具]

    ZoomIt – 屏幕标注.电子画笔 [小工具] 目錄 [ZoomIt – 簡單易用的簡報工具 小工具] ZoomIt 是一款簡單易用的綠色簡報小工具,無需安裝即可使用.作者 Mark Russino ...

  3. Proxmark3教程3:IC卡三文件数据比对工具,轻松找出不同和相同

    大家好,今天给大家介绍一款大杀器! IC卡做数据分析时,经常会用到数据比对,有时候为了找到数据的变化规律,可能要采集好多个dump数据. 针对多个数据,有时需要两两比对,少不了3个文件同时比对的情况, ...

  4. oracle 数据比对工具

    https://www.devart.com/ 以上网站有oracle 数据比对工具 dbForge Data Compare for Oracle 比较相同表结构,但数据不一样,数据批量操作入库的时 ...

  5. 生产力工具-笔记、任务管理工具软件,让你的时间更加有用!

    生产力工具-笔记.任务管理工具软件,让你的时间更加有用! 电脑离不开了,工作和生活中是必需品,玩电脑玩的转,效率就高,做完工作还有玩游戏的时间,下面就介绍一下提高工作效率的小软件工具. 常用的小软件工 ...

  6. ini文件怎么使用_ftp文件下载工具,ftp文件下载工具是怎么使用的?使用指南

    ftp文件下载工具是什么工具,可能有人会回答说不知道,因为一般只有从事网站管理的工作者会使用的多一点.但不是每个人生来就会的,所以刚开始肯定都会学习怎么使用.这篇文章就来教一下大家ftp文件下载工具是 ...

  7. iOS开发工具——网络封包分析工具Charles

    iOS开发工具--网络封包分析工具Charles 简介 Charles是在Mac下常用的截取网络封包的工具,在做iOS开发时,我们为了调试与服务器端的网络通讯协议,常常需要截取网络封包来分析.Char ...

  8. 【Groovy】构建工具 ( 构建工具引入 | Gradle 构建工具作用 | 传统的依赖管理 )

    文章目录 一.构建工具引入 二.Gradle 构建工具作用 三.传统的依赖管理 一.构建工具引入 构建工具 用于 管理代码项目的 依赖 , 编译 , 测试 , 发布 周期 ; 常见的构建工具 : An ...

  9. 【Windows 逆向】CE 地址遍历工具 ( CE 结构剖析工具 | 尝试进行瞬移操作 | 尝试查找飞天漏洞 )

    文章目录 一.尝试进行瞬移操作 二.尝试查找飞天漏洞 一.尝试进行瞬移操作 在上一篇博客 [Windows 逆向]CE 地址遍历工具 ( CE 结构剖析工具 | 人物数据内存结构 | 人物三维坐标数据 ...

最新文章

  1. 一个类怎样引用另外一个类的成员变量或方法
  2. 分享我常用的5个免费的在线 SQL 数据库环境,简直太方便了!
  3. 面试再也不怕问到HashMap(二)
  4. OSGI 插件操作命令
  5. 字典-变量的定义以及应用场景
  6. centos 对已有卷扩容_centos7下对原有磁盘分区进行在线扩容
  7. 关联分析算法c语言实现,机器学习关联分析
  8. 如果您不将Docker用于数据科学项目,那么您将生活在1985年
  9. 利用.dSYM和.app文件准确定位Crash位置
  10. 青蛙的约会(洛谷-P1516)
  11. Linux 软件看门狗 watchdog 喂狗
  12. ImportError: No module named _internal
  13. 二级c语言准考证,考试准考证打印
  14. google“退出”中国?
  15. 【C语言】计算一元二次方程的解
  16. 用电脑开热点启用电脑无线配置
  17. php gps定位范围算法,基本的GPS卫星定位算法
  18. Java Faker 生成随机数
  19. Elsevier模板(1)
  20. ARM内核、指令集等简介

热门文章

  1. 使用html5写见缝插针源码,HTML5见缝插针手机游戏代码-闯三关送口红.zip
  2. 智能共享口红机方案/案列/APP/小程序/开发
  3. 人工智能应用最多的七大领域解析
  4. 跨境电商财税合规问题汇总 如何推动跨境电商财税合规
  5. windows 录屏软件
  6. 马士兵 oracle seton,马士兵Oracle 下
  7. BestCoder Round #86 HDU 5804,HDU 5805,HDU 5806,HDU 5807
  8. 电脑相机出现0xA00F4289<ActiveCameraUnplugged>和0xA00F4244错误代码
  9. 第031讲:永久存储:腌制一缸美味的泡菜
  10. 小狼的单身情话之HTML网页标签和段落的初级教学