Aspera

  • 简介:Aspera是一款高速传输软件,不受文件大小,网络条件等影响,速度比HTP和FTTP协议快数百倍。Windows和Linux系统均可下载使用。

1.Windows下载:浏览器直接搜索Aspera-connect下载浏览器插件。
2.Ubuntu下载:

1.下载Aspera-connec:wget https://download.asperasoft.com/download/sw/connect/3.6.2/aspera-connect-3.6.2.117442-linux-64.tar.gz
2.解压缩:tar zvxf aspera-connect-3.6.2.117442-linux-64.tar.gz
3.运行:sh aspera-connect-3.6.2.117442-linux-64.sh
(此时在home目录下会生成 `.aspera` 的隐藏文件,使用 ls -a 命令可查看)
4.添加环境变量:echo 'export PATH=~/.aspera/connect/bin:$PATH' >>~/.bashrc  #正确的添加应该是 vim ~/.bashrc ,然后在最后加上export PATH=“~/.aspera/connect/bin:$PATH”,最后 source ~/.bashrc
5.使其生效:source ~/.bashrc
6.拷贝秘钥文件:cp ~/.aspera/connect/etc/asperaweb_id_dsa.openssh ~/
7.拷贝协议文件:sudo cp ~/.aspera/connect/etc/aspera-license /usr/local/bin/
  • Aspera命令行工具的使用:ascp [参数] 目标文件 目的地址

  • ascp常用参数:

  1. -T ---- 取消加密。若不添加此参数,可能会下载不了。 
  2. -i ---- 输入私钥,一般不要少。安装 aspera 后在目录 ~/.aspera/connect/etc/ 下有几个私钥, 使用 linux 服务器的时候一般使用 asperaweb_id_dsa.openssh 文件作为私钥。 
  3. -l string ----- 设置最大传输速度,比如设置为 200M 则表示最大传输速度为 200m/s。 若不设置该参数,则一般可达到10m/s的速度,而设置了,传输速度可以更高。
  4. -k ---- 断点续传 ,一般设置为1
  5. -v ---- 可以实时知道程序在做什么,方便查错
  6. -Q --- 一般加上吧
  7. --host=string --- ftp的host名,NCBI的为ftp-private.ncbi.nlm.nih.gov;EBI的为 fasp.sra.ebi.ac.uk。 
  8. --user=string --- 用户名,NCBI的为anonftp,EBI的为era-fasp。 
  9. --mode=string --- 选择模式,上传为 send,下载为 recv。 
  10. --file-list --- 批量下载SRA文件的路径

二,在SRA数据库中下载数据

  • 简介:SRA数据库是用于存储二代测序的原始数据的数据库。除了原始序列数据外,SRA现在也存在raw reads在参考基因的比对信息。

根据SRA数据产生的特点,将SRA数据分为四类:
Studies-- 研究课题,用前缀ERP或SRP表示
Experiments-- 实验设计,用前缀SRS表示

Runs-- 测序结果集,用前缀SRX表示                              Illumina的测bai序仪是以flowcell进行测序的,一般的一张flowcell是一个run,像Hiseq2500的话是2张flowcell,也就是一次运行的测序量。每张flowcell上通常都有多个通道,每个通道可以单独测不同的样品,这样的通道就是lane。Hiseq2500的一张flowcell有8条通道,也就是8个lane。如果上机前使用cbot的话可以每条lane都跑不同的样品,互不干扰,如果直接上机进行快速模式的话就无法区分不同样本了             lane表示测序芯片上的一条流通槽,测序文库与试剂均在里面,测序信号的扫描也是按照一条lane上的一个tile进行。

Samples-- 样品信息。用前缀SRR表示

  • SRA中数据结构的层次关系为:Studies->Experiments->Samples->Runs

1、使用Aspera获取单个SRA数据:

  1. 首先知道SRA数据库数据的存放地址是ftp-private.ncbi.nlm.nih.gov,使用时加上ftp://或者http://,SRA在Aspera的用户名是anonftp
  2. 通过输入上述链接(这是已知accession no.的情况下可以直接查找,不知道accession no.的可以去SRA主页查找)然后逐步定位到需要查找的accession no,获得链接。
  3. 以 SRR6208854为例,可以得到链接ftp://ftp.ncbi.nlm.nih.gov/sra/srainstant/reads/ByRun/sra/SRR/SRR620/SRR6208854/SRR6208854.sra
    ftp://ftp.ncbi.nlm.nih.gov改为anonftp@ftp-private.ncbi.nlm.nih.gov:/注意不要少了:
  4. 完整代码如下:
ascp -v -i ~/.aspera/connect/etc/asperaweb_id _dsa.openssh -T -k 1 -l 200m anonftp@ftp-private.

作者:Lillian李李安
链接:https://www.jianshu.com/p/ba996eb39ab4
来源:简书
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

Aspera 下载_SRA原始数据下载相关推荐

  1. GIS+=地理信息+行业+大数据——纽约公开11亿条出租车和Uber原始数据下载及分析

    一览众山小编辑团队 原文/ Todd Schneider 翻译/ 沈玮薇 陈翚 文献/ 蒋理 校核/ 众山小编辑/ 众山小 排版/ 徐颖 2014-2015 © 转载请注明:源自公众号"一览 ...

  2. GIS+=地理信息+行业+大数据——纽约公开11亿条出租车和Uber原始数据下载及分析...

    一览众山小编辑团队 原文/ Todd Schneider 翻译/ 沈玮薇 陈翚 文献/ 蒋理 校核/ 众山小编辑/ 众山小 排版/ 徐颖 2014-2015 © 转载请注明:源自公众号"一览 ...

  3. linux下载测序数据,利用SRA号从NCBI下载测序原始数据

    生物或医学中涉及高通量测序的论文,一般会将原始测序数据上传到公开的数据库,上传方式见测序文章数据上传找哪里:并在文章末尾标明数据存储位置和登录号,如 The data from this study ...

  4. osm数据下载 python_批量下载osm的分区域的osm文件

    # coding: utf-8 #!/usr/bin/python # #### http://www.openstreetmap.org 的分区后的osm数据批量下载工具(需要python的requ ...

  5. osm数据下载 python_osm数据下载 python_批量下载osm的分区域的osm文件

    # coding: utf-8 #!/usr/bin/python # #### http://www.openstreetmap.org 的分区后的osm数据批量下载工具(需要python的requ ...

  6. android源码下载方法 批量下载 基于windows os

    安装win版的Gitbash, 在这里 http://msysgit.googlecode.com/files/Git-1.6.0.2-preview20080923.exe. 选择默认安装路径(否则 ...

  7. spring原理案例-基本项目搭建 01 spring framework 下载 官网下载spring jar包

    下载spring http://spring.io/ 最重要是在特征下面的这段话,需要注意: All avaible features and modules are described in the ...

  8. python视频下载-python动态视频下载器的实现方法

    这里向大家分享一下python爬虫的一些应用,主要是用爬虫配合简单的GUI界面实现视频,音乐和小说的下载器.今天就先介绍如何实现一个动态视频下载器. 爬取电影天堂视频 首先介绍的是python爬取电影 ...

  9. python下载地址-python下载网址

    广告关闭 2017年12月,云+社区对外发布,从最开始的技术博客到现在拥有多个社区产品.未来,我们一起乘风破浪,创造无限可能. python下载windows下载windows下载页面https:ww ...

最新文章

  1. 第三章:创建用户界面组件--可视化组件(一)
  2. 操作系统的八股文自述(持续更新)
  3. 陶哲轩实分析 习题 7.2.6 (嵌套级数)
  4. java rxtx version_java – 不匹配的RXTX版本
  5. Eclipse反编译插件安装
  6. 企业——memcache对PHP页面的缓存加速优化
  7. Angular应用Base Element Href属性的设置
  8. oracle10g检测未通过,win64bit安装oracle 10g版本检查未通过解决 提示要求的结果: 5.0,5.1,5.2,6.0 之一 实际结果: 6.1...
  9. Centos安装NFS服务器配置及挂载教程
  10. Python使用模块中对象的几种方法
  11. 插头DP题目泛做(为了对应WYD的课件)
  12. 实现冒泡排序和选择排序
  13. javascript学习一、js的初步了解
  14. 【渝粤题库】陕西师范大学165109 绩效管理 作业(高起专)
  15. 泡泡龙游戏开发系列教程(四)
  16. 名利如过往云烟,知足就好
  17. 如何使用阿里云进行人脸和身份证头像验证比对(人证核验接口API)--java
  18. Gluster管理命令的总结与归纳
  19. npm run serve 报错:Error: error:0308010C:digital envelope routines::unsupported
  20. AD中怎样修改原理图图纸大小

热门文章

  1. Tomcat优化(AJP 执行器 运行模式 参数优化)
  2. 测试服务API的_苏飞开发助手_使用说明
  3. 打印树形图(二叉树)
  4. 未来发展?智能AI革命与脑联网领域
  5. 解决使用pycharm安装keras-tuner后tensorflow-gpu 2.5.0无法使用的问题
  6. 三阶魔方入门解法--层先法
  7. macos 清空dns缓存_如何在macOS上重置DNS缓存
  8. Docker一键脚本安装、命令使用和常用软件安装
  9. 基于ZooKeeper的服务注册实现
  10. A Load Balanced Mapping for Spiking Neural Network