linux 下载sra数据库,NCBI下载SRA数据和之后的数据处理
一,下载该软件
wget http://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/current/sratoolkit.current-ubuntu64.tar.gz
tar xzf sratoolkit.current-centos_linux64.tar.gz
解压直接使用即可,里面有一大堆的软件,针对不同的测序仪,不同的数据
我一般只用/home/jmzeng/down_software/sratoolkit.2.3.5-2-ubuntu64/bin/fastq-dump
/home/jmzeng/down_software/sratoolkit.2.3.5-2-ubuntu64/bin/fastq-dump --split-3 SRR1793917.sra
二:下载数据
首先去NCBI里面搜索并找到你想要的数据的SRA地址,然后写脚本批量下载。
如果文献里面的SRA号,那么可以直接打开NCBI里面的搜索界面下载
如果文献里面是SRP号,那么该SRP会涉及到好几个SRA数据,得一个个开网站下载
三:用命令解压数据
下载之后的数据是
非常简单的命令,就可以把当前文件夹下的所有sra都解压开来!
[shell]
for i in *sra
do
echo $i
/home/jmzeng/bio-soft/sratoolkit.2.3.5-2-ubuntu64/bin/fastq-dump
--split-3 $i
done
[/shell]
解压的同时它也会显示每个SRA文件的数据量
四:结果文件解读
可以看到,每个SRA文件都产生了两个reads,分别是左右两端测序,说明这个SRA文件是双端测序策略。
随便打开一个fastq文件可以看到,它的读长是300bp
linux 下载sra数据库,NCBI下载SRA数据和之后的数据处理相关推荐
- 从NCBI当中SRA数据库中下载高通量测序数据
从NCBI当中SRA数据库中下载高通量测序数据 NCBI sra 数据下载 用迅雷替代官方的prefetch批量下载SRA测序数据,更快更稳定! 用别人的数据,发自己的文章 由于大多数杂志在文章发表前 ...
- linux下载sra数据库,NCBI SRA数据库使用详解
做为一个合格的生物信息菜鸟,没钱测序咋整,免不了到处求数据呀找数据.....练好基本功必须先从找数据开始!今天小编就来介绍一下一个存储大量高通量数据的的数据库-SRA. 1.简介 SRA(Sequen ...
- SRA数据库及linux本地下载
目录 一.SRA数据库 二.SRA数据库下载 1.SRA Toolkit下载数据 1.1. 下载压缩包 1.2. 解压及配置环境 1.3.下载.sra文件以及转换.fastq文件 2.wget, cu ...
- 下载NCBI的SRA数据 详细教程
SRA(Sequence ReadArchive)数据库是NCBI(National Center for Biotechnology Information)旗下用于存储高通量测序数据的子库.来自世 ...
- NCBI中SRA数据库简介
NCBI中SRA数据库简介 SRA数据库简介 SRA 数据库, 为Sequence Read Archive 的缩写.主要存储高通量测序的数据,来自四个测序平台,分别为: Roche_LS454,Il ...
- SRA数据库的各种编号(DRP, ERP 或SRP)
S R A 数据库, 最初的命名为Short Read Archive,现已改为SequenceRead Archive. SRA 数据库的组织架构 1,meta 数据是指与测序实验及其实验样品相关的 ...
- MySql数据库的下载安装及使用(2020最新版)
一,下载MySql数据库 链接: 下载地址. 默认windows版本,需要其他版本的可以从官网寻找 点它,然后静静的等待下载 二,安装MySql数据库 打开它长这样 一路execute.next就可以 ...
- SRA数据库的各种编号
S R A 数据库, 最初的命名为Short Read Archive,现已改为SequenceRead Archive. SRA 数据库的组织架构 1,meta 数据是指与测序实验及其实验样品相关的 ...
- linux下载sra数据库,NCBI-SRA数据下载的3种方法
SRA 数据库, 为Sequence Read Archive 的缩写.主要存储高通量测序的原始数据,来自四个测序平台,分别为:Roche_LS454,Illumina,ABI_SOLID和HELIC ...
最新文章
- opencv meanStdDev
- 制作简单的2D物理引擎(零)
- Java 约瑟夫环(循环链表解决)
- elementUI使用之table表格如何给行元素添加点击事件
- php机器人聊天对话框,仿机器人聊天窗口(热身)
- 计算机网络学习(六)—网络层概述以及相关习题
- 闰年的判断方法_练习题079:如何判断某年为闰年
- Jenkins中集成Gcov代码覆盖率报告
- Android 四大组件学习之ContentProvider四
- QQ2017熄灭“QQ游戏图标”方法
- java poi Excel加密文件导出和下载
- oracle gi和gc的区别,别装了,你肯定对GI有什么误解,这才是争取的区别不要弄错...
- IBM面试题 50条狗 有病狗 有几条病狗?
- 207最新android书籍,《最强Android书 架构大剖析》PDF(高清版)
- crm系统客户池功能流程泳道图
- Mac 远程连接树莓派-不使用拓展坞
- 如何查看、复制caj、PDF文件文本内容
- 基于ip的手机地理定位
- verilog实现时钟的时和分,其中时为24进制,分为60进制
- Pytorch学习中的Dataset与DataLoad的一些自己的理解
热门文章
- 货币数字转换成中文大写的函数
- 签到考勤java课设_Java程序设计课程设计学生考勤系统Word版
- Unity il2cpp.exe 已停止工作 CLR20r3
- 我的Java Web之路 - HTML(1)
- ajax上传多文件和数据,Ajax上传数据和上传文件(三种方式)
- 使用AJAX上传文件(前后端不分离)
- 音频AAC编码的RTMP直播
- 网页中引用下载好的字体文件(.ttf)
- pdf文件太大怎么缩小?试试这两招吧!
- java计算机毕业设计石家庄市居家养老服务平台源程序+mysql+系统+lw文档+远程调试