使用fastq-dump下载SRA数据
使用fastq-dump下载SRA数据
环境和配置请见系列博文
1.下载:
fastq-dump -Z DRR047093
然后会显示信息:如果文件过大会有很多
可以显示制定条数
fastq-dump -X 5 -Z DRR047093
文件位置:自己安装sratoolkit时配置的位置
hadoop@Mcnode1:~/cloud/adam/xubo/data/down-sratool/sra$ ll
total 7532
drwxrwxr-x 2 hadoop hadoop 4096 1月 13 17:17 ./
drwxrwxr-x 7 hadoop hadoop 4096 1月 13 16:16 ../
-rw-rw-r-- 1 hadoop hadoop 5270322 1月 13 17:17 DRR047093.fastq
-rw-rw-r-- 1 hadoop hadoop 1043468 1月 13 17:16 DRR047093.sra
-rw-rw-r-- 1 hadoop hadoop 1701387928 1月 13 17:12 SRR003161.sra.cache
2.prefetch
hadoop@Mcnode1:~/.aspera/connect/bin$ prefetch -c DRR047084
Maximum file size download limit is 20,971,520KB
2016-01-13T13:42:20 prefetch.2.5.5: 1) Downloading 'DRR047084'...
2016-01-13T13:42:20 prefetch.2.5.5: Downloading via fasp...
2016-01-13T13:42:41 prefetch.2.5.5 err: process failed while waiting process - ascp failed with 1
2016-01-13T13:43:13 prefetch.2.5.5 err: process failed while waiting process - ascp failed with 1
2016-01-13T13:43:13 prefetch.2.5.5: fasp download failed
2016-01-13T13:43:13 prefetch.2.5.5: Downloading via http...
2016-01-13T13:43:41 prefetch.2.5.5: 1) 'DRR047084' was downloaded successfully
2016-01-13T13:43:41 prefetch.2.5.5: 'DRR047084' has 0 dependencies
查看效果:成功
hadoop@Mcnode1:~/cloud/adam/xubo/data/down-sratool/sra$ ll -h
total 252M
drwxrwxr-x 2 hadoop hadoop 4.0K 1月 13 21:43 ./
drwxrwxr-x 7 hadoop hadoop 4.0K 1月 13 16:16 ../
-rw-rw-r-- 1 hadoop hadoop 877K 1月 13 21:40 DRR047083.sra
-rw-rw-r-- 1 hadoop hadoop 1007K 1月 13 21:43 DRR047084.sra
-rw-rw-r-- 1 hadoop hadoop 1.1M 1月 13 21:33 DRR047091.sra
-rw-rw-r-- 1 hadoop hadoop 1.2M 1月 13 17:22 DRR047092.sra
-rw-rw-r-- 1 hadoop hadoop 5.1M 1月 13 20:31 DRR047093_1.fastq
-rw-rw-r-- 1 hadoop hadoop 5.1M 1月 13 17:17 DRR047093.fastq
-rw-rw-r-- 1 hadoop hadoop 1020K 1月 13 17:16 DRR047093.sra
-rw-rw-r-- 1 hadoop hadoop 180K 1月 13 20:32 RAL357_1.sai
-rw-rw-r-- 1 hadoop hadoop 5.2M 1月 13 20:36 RAL357_1.sam
-rw-rw-r-- 1 hadoop hadoop 271M 1月 13 21:28 SRR002664.sra.cache
-rw-rw-r-- 1 hadoop hadoop 1.6G 1月 13 20:26 SRR003161.sra.cache
-rw-rw-r-- 1 hadoop hadoop 0 1月 13 21:19 SRR003162.sra.lock
-rw-rw-r-- 1 hadoop hadoop 15M 1月 13 21:34 SRR003162.sra.tmp.98592.tmp
-rw-rw-r-- 1 hadoop hadoop 0 1月 13 21:43 SRR1482462.sra.lock
-rw-rw-r-- 1 hadoop hadoop 0 1月 13 21:40 --user=anonftp
链接到的下载地址是:http://sra-download.ncbi.nlm.nih.gov/srapub/SRR003162
文件大概1.6G
之前运行这两个语句都不行,不知道是不是网络的原因??
3.prefetch -v
hadoop@Mcnode1:~/.aspera/connect/bin$ prefetch -v DRR047083
Maximum file size download limit is 20,971,520KB2016-01-13T13:38:40 prefetch.2.5.5: Using 'ascp'
2016-01-13T13:38:40 prefetch.2.5.5: Using 'ascp'
2016-01-13T13:38:40 prefetch.2.5.5: Using '/home/hadoop/.aspera/connect/bin/ascp'
2016-01-13T13:39:00 prefetch.2.5.5: 1) Downloading 'DRR047083'...
2016-01-13T13:39:00 prefetch.2.5.5: Downloading via fasp...
/home/hadoop/.aspera/connect/bin/ascp /home/hadoop/.aspera/connect/bin/ascp -i /home/hadoop/.aspera/connect/etc/asperaweb_id_dsa.openssh -pQTk1 -l 1000m dbtest@sra-download.ncbi.nlm.nih.gov:data/sracloud/srapub/DRR047083 /home/hadoop/cloud/adam/xubo/data/down-sratool/sra/DRR047083.sra.tmp.96547.tmp
2016-01-13T13:39:15 prefetch.2.5.5 err: process failed while waiting process - ascp failed with 1
/home/hadoop/.aspera/connect/bin/ascp /home/hadoop/.aspera/connect/bin/ascp -i /home/hadoop/.aspera/connect/etc/asperaweb_id_dsa.openssh -pQTk1 -l 1000m dbtest@sra-download.ncbi.nlm.nih.gov:data/sracloud/srapub/DRR047083 /home/hadoop/cloud/adam/xubo/data/down-sratool/sra/DRR047083.sra.tmp.96547.tmp
2016-01-13T13:39:30 prefetch.2.5.5 err: process failed while waiting process - ascp failed with 1
2016-01-13T13:39:30 prefetch.2.5.5: fasp download failed
2016-01-13T13:39:30 prefetch.2.5.5: Downloading via http...
2016-01-13T13:40:06 prefetch.2.5.5: http://sra-download.ncbi.nlm.nih.gov/srapub/DRR047083 -> /home/hadoop/cloud/adam/xubo/data/down-sratool/sra/DRR047083.sra.tmp.96547.tmp
2016-01-13T13:40:10 prefetch.2.5.5: /home/hadoop/cloud/adam/xubo/data/down-sratool/sra/DRR047083.sra.tmp.96547.tmp (897071)
2016-01-13T13:40:10 prefetch.2.5.5: 1) 'DRR047083' was downloaded successfully
2016-01-13T13:40:10 prefetch.2.5.5: 'DRR047083' has 0 unresolved dependencies
2016-01-13T13:40:10 prefetch.2.5.5: 'DRR047083' is not cSRA
成功:
hadoop@Mcnode1:~/cloud/adam/xubo/data/down-sratool/sra$ ll -h
total 251M
drwxrwxr-x 2 hadoop hadoop 4.0K 1月 13 21:42 ./
drwxrwxr-x 7 hadoop hadoop 4.0K 1月 13 16:16 ../
-rw-rw-r-- 1 hadoop hadoop 877K 1月 13 21:40 DRR047083.sra
-rw-rw-r-- 1 hadoop hadoop 0 1月 13 21:42 DRR047084.sra.lock
-rw-rw-r-- 1 hadoop hadoop 1.1M 1月 13 21:33 DRR047091.sra
-rw-rw-r-- 1 hadoop hadoop 1.2M 1月 13 17:22 DRR047092.sra
-rw-rw-r-- 1 hadoop hadoop 5.1M 1月 13 20:31 DRR047093_1.fastq
-rw-rw-r-- 1 hadoop hadoop 5.1M 1月 13 17:17 DRR047093.fastq
-rw-rw-r-- 1 hadoop hadoop 1020K 1月 13 17:16 DRR047093.sra
-rw-rw-r-- 1 hadoop hadoop 180K 1月 13 20:32 RAL357_1.sai
-rw-rw-r-- 1 hadoop hadoop 5.2M 1月 13 20:36 RAL357_1.sam
-rw-rw-r-- 1 hadoop hadoop 271M 1月 13 21:28 SRR002664.sra.cache
-rw-rw-r-- 1 hadoop hadoop 1.6G 1月 13 20:26 SRR003161.sra.cache
-rw-rw-r-- 1 hadoop hadoop 0 1月 13 21:19 SRR003162.sra.lock
-rw-rw-r-- 1 hadoop hadoop 15M 1月 13 21:34 SRR003162.sra.tmp.98592.tmp
-rw-rw-r-- 1 hadoop hadoop 0 1月 13 21:40 --user=anonftp
使用fastq-dump下载SRA数据相关推荐
- 干货分享 | Windows系统下载SRA数据方法——生信小白亲测可行
在开展二代测序相关课题研究时,经常需要上传或者下载SRA数据库中的数据,对熟悉Linux系统.懂代码的同学们来说是非常容易的事情.但像小编这一类看到代码两眼一抹黑的小白就有点难度了,尤其电脑还是Win ...
- 如何linux下载sra数据,下载sra数据
今天又要开始摸鱼了.记录下下载sra数据的历程.曲折啊. 下载sra files的目的是为了获得相应的fastq或sam files,进而进行分析. 第1选择 -- Aspera Connect 如果 ...
- 批量下载sra文件linux,Linux下从NCBI批量下载SRA数据的sra和aspera方法
Minus_yao 2018.04.25 yaoguocai_cool@163.com #从NCBI下载SRA数据,最近在疯狂下载宏基因组数据,试着解决一下这个问题~ 方法一: 软件准备: 使用n ...
- Linux下从NCBI批量下载SRA数据的sra和aspera方法
Minus_yao 2018.04.25 yaoguocai_cool@163.com #从NCBI下载SRA数据,最近在疯狂下载宏基因组数据,试着解决一下这个问题~ 方法一: 软件准备: 使用n ...
- aspera下载sra文件linux,Aspera Connect,高速下载sra数据
一.下载安装Aspera Connect Linux系统下的Aspera Connect安装(Windows下的Aspera Connect安装参考). 查看最新版本的Aspera - High-sp ...
- aspera下载sra文件linux,使用aspera下载.fastq.gz和.sra数据
aspera SRA数据库: Sequence Read Archive:隶属NCBI (National Center for Biotechnology Information),它是一个保存高通 ...
- prefetch下载SRA 数据
1. SRA数据库简单介绍 序列读取档案(SRA)存储来自"下一代"测序技术的原始序列数据,包括Illumina.454.IonTorrent.Complete Genomics. ...
- NCBI下载SRA数据的4种方法
作为生命科学的从事者,不论是老师或者学生都应该用过NCBI((National Center for Biotechnology Information Search database,一个综合性的生 ...
- RNA-seq——快速下载SRA数据、解决fq文件中测序质量全为 ‘?‘ 的问题
写在前面--在学习RNA-seq时,需要从网上下载公开数据集来上手分析,大部分教程都很古老,其中在ncbi中ftp的下载链接已经不存在了,甚至可以直接下载fastq文件.但是,直接下载的fastq文件 ...
最新文章
- Gartner十大IT预测:七大数字巨头,有五家将心甘情愿“自我颠覆”
- 轮距和轴距有什么区别_为什么很多国产车都设计得窄高窄高的,是为了节省成本吗?...
- JDK8对并发的新支持
- python制作训练集_利用Tensorflow简单实现VGGNet,从数据集制作到训练完成测试
- pycharm中一直跳出updating indices...indexing
- 《PWA实战:面向下一代的Progressive Web APP》读书笔记
- RHCS集群原理概述
- Linux进度条的实现
- 从1亿个ip中找出访问次数最多的IP
- Linux ACL 权限
- linux 64 mysql下载官网_Linux下安装MySQL5.7
- inDesign教程,如何创建风格化的书籍封面?
- idea2019配置
- 高通模式9008模式linux,高通芯片如何进入9008模式深度救砖
- ppt插入html(用office而不是wps)
- 毕业论文给图、表格、公式编号(不设置多级列表)
- android hid 触摸屏驱动,针对USB接口触摸屏HID免驱触摸屏配置方法
- 王垠 java,王垠,40行代码,JAVA吧的大神怎么评论?
- Maven是主要干嘛的呢
- Linux文件系统管理——创建与检测
热门文章
- MATLAB考前复习知识点
- sona: Spark on Angel部署教程
- Vue: wangEditor 编辑器使用示例
- mysql初始化加载插件_Hapi+MySql项目实战配置插件-加载文件渲染母版(三)
- [USACO 2009 Dec S]Music Notes
- linux 萌字体,Linux平台上的Ubiqutous字体
- 面试官:聊聊 Java 的几把 JVM 级锁吧
- Python-Django毕业设计动漫网站(程序+Lw)
- 微信小程序学习6:页面生命周期回调函数
- LVS负载均衡之流量转发过程、lvs简介