SRA数据的的处理流程大概如下

一、SRA数据下载、

NCBI 上存储的数据现在大都存储为SRA格式。

下载以后就是以SRA为后缀名。

这里可以通过三种方式下载SRA格式的数据。

1.通过http方式,2.通过ftp方式,3.通过Aspera

Aspera可以在NCBI网站上下载。

参阅:http://www.ncbi.nlm.nih.gov/books/NBK47540/

二、SRA格式转换成FASTQ格式

./fastq-dump -A SRR058977 ~/project/yanzi/data/GEO/SRA/SRR058977.sra

fastq-dump可以在ncbi官方网站下载,这里面包含一系列的转换工具;

参阅:http://www.ncbi.nlm.nih.gov/books/NBK56560/

http://eutils.ncbi.nih.gov/Traces/sra/?view=software

转换成FASTQ,SFF,lllumina native,AB SOLiD native等格式;

另,转换FASTQ以后要转换成FASTA 命令如下:

awk '{if(FNR%4==1) print ">",$0; else if(FNR%4==2) print $0;}' a.fastq >a.fasta

————————----------------------------------------------------------------

以上部分为预处理部分:

当然我做的方向是比对方向,就可以用fasta做比对工作了。

………………………………………………………………………………………………………………………………………………………………………………………………

后面还可以做其他反面的研究:

3.去接头(此步要注意是否有接头,一般RNA-SEQ数据应该是没有接头的)

4.用tophat寻找可变剪切

tophat -r 42 -G genome.fa -o PF genomeIndex SRR058977.fastq

5.用cufflinks找不同组织中的差异

cuffdiff genomeAnnotation.gff   ../BF/accept.bam ./accept.bam

来源:http://blog.sciencenet.cn/blog-565558-626137.html

…………………………………………………………………………………………………………………………………………………………

可能会用到的修改目录权限的linux命令

Linux改变分区权限(简单好用版)

原理:

1.在Linux和Unix世界里,一切都是以文件的形式存在的。文件夹是文件,文件是文件,设备也是文件。
2.分区在挂载后,会在 /media/ 下以文件夹的形式显现
3.chmod用于修改权限 而chmod ugo+rwx 用于给所有的用户和用户组添加所有的权限

步骤:
1.假设需要修改权限的分区名为x
2.挂载x
3.赋权

代码:
sudo chmod ugo+rwx /media/x

转载于:https://www.cnblogs.com/suncoolcat/p/3283656.html

NCBI SRA数据预处理相关推荐

  1. 在linux系统下怎么下载sra数据,NCBI sra数据下载软件安装

    引用网址: 1.SRA Toolkit 的安装 cd /opt/ wget ftp-trace.ncbi.nlm.nih.gov/sra/sdk/current/sratoolkit.current- ...

  2. NCBI下载SRA数据的4种方法

    作为生命科学的从事者,不论是老师或者学生都应该用过NCBI((National Center for Biotechnology Information Search database,一个综合性的生 ...

  3. 批量下载sra文件linux,Linux下从NCBI批量下载SRA数据的sra和aspera方法

    Minus_yao  2018.04.25  yaoguocai_cool@163.com #从NCBI下载SRA数据,最近在疯狂下载宏基因组数据,试着解决一下这个问题~ 方法一: 软件准备: 使用n ...

  4. NCBI中SRA数据下载

    NCBI中SRA数据下载 hs6605015 2020-08-02 14:35:34  1170  收藏 8 版权 应用场景: 如果自己没有测序数据,比如Pacbio数据,nanopore数据等,想要 ...

  5. 批量下载sra文件linux,NCBI下载SRA数据的4种方法

    作为生命科学的从事者,不论是老师或者学生都应该用过NCBI((National Center for Biotechnology Information Search database,一个综合性的生 ...

  6. linux 下载sra数据库,NCBI下载SRA数据和之后的数据处理

    一,下载该软件 wget http://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/current/sratoolkit.current-ubuntu64.tar.gz ta ...

  7. 下载NCBI的SRA数据 详细教程

    SRA(Sequence ReadArchive)数据库是NCBI(National Center for Biotechnology Information)旗下用于存储高通量测序数据的子库.来自世 ...

  8. Linux下从NCBI批量下载SRA数据的sra和aspera方法

    Minus_yao  2018.04.25  yaoguocai_cool@163.com #从NCBI下载SRA数据,最近在疯狂下载宏基因组数据,试着解决一下这个问题~ 方法一: 软件准备: 使用n ...

  9. GEO,以GSM2309041这套数据为例,找到需要的sra数据,SRX2159543

    1.首先,进入GEO,以GSM2309041这套数据为例,找到需要的sra数据,SRX2159543 2.然后在GEO profile中搜索SRX2159543 点击:如下图所示: 点击Downloa ...

最新文章

  1. 【Graph4NLP】阿尔伯塔大学博士毕业论文:基于图结构的自然语言处理
  2. OpenCV作图像处理和识别方面的编程时常用的基础语句积累
  3. 记录一次Mac虚拟机安装的过程(有图有真相)
  4. 0.0 环境搭建 - PyTorch学习笔记
  5. 无聊的python课程_无聊的钢镚的python学习之路
  6. zk服务器系统,windows系统搭建zookeeper服务器的教程
  7. Request_获取请求头数据
  8. 微信小程token_微信小程序开发之登录换取token
  9. TensorFlow GAN项目程序回顾2020.12.03
  10. cocos2d cocostudio
  11. cadence SPB17.4 allegro + CAM350 10.5 / 10.7 / 14.6 出拼板
  12. 极限学习机(ELM)从原理到程序实现(附完整代码)
  13. EDA实验:(DTTIMES)数字秒表的设计
  14. YAML文件格式详解
  15. 程序员如何变身IT讲师
  16. NCTF-Writeup
  17. jQuery键盘打字练习效果
  18. python中numpy中的shape和get_shape解析
  19. mysql创建储存过程 输入学生名子_创建一个存储过程,给定某学生学号,要求查询出该学生的姓名,所选课程名和成绩.(SQL SERVER)...
  20. XP计算机桌面锁定进不去,[xp系统开机进不了桌面]启动进不去桌面上,电脑开机进不去桌面上怎么解决...

热门文章

  1. Ubuntu 无法应用原保存的显示器配置
  2. Arcengine 基本操作(待更新)
  3. 再看数据库——(2)视图
  4. vc的UI编程PngTextButton控件的适用情况
  5. [转]关于数据库的并发性的一个解决方案
  6. VC返回文件所在的路径
  7. 本题要求实现一个用选择法对整数数组进行简单排序的函数。_通俗易懂讲 Python 算法:快速排序...
  8. vue路由传参的三种基本方式
  9. AndroidStudio中Flutter打包APK
  10. 微信小程序自定义组件生命周期