biopython:基因genbank格式转核酸或氨基酸fasta格式
genbank to fasta 核酸
from Bio import SeqIO
gbk_filename = "c00079_GUT_GEN...region001.gbk"
faa_filename = "c00079_GUT_GEN...region001.fna"
input_handle = open(gbk_filename, "r")
output_handle = open(faa_filename, "w")for seq_record in SeqIO.parse(input_handle, "genbank") :print("Dealing with GenBank record %s" % seq_record.id)output_handle.write(">%s %s\n%s\n" % (seq_record.id,seq_record.description,seq_record.seq))output_handle.close()
input_handle.close()
genbank to fasta 氨基酸
from Bio import SeqIO
gbk_filename = "NC_005213.gbk"
faa_filename = "NC_005213_converted.faa"
input_handle = open(gbk_filename, "r")
output_handle = open(faa_filename, "w")for seq_record in SeqIO.parse(input_handle, "genbank") :print("Dealing with GenBank record %s" % seq_record.id)for seq_feature in seq_record.features :if seq_feature.type=="CDS" :assert len(seq_feature.qualifiers['translation'])==1output_handle.write(">%s from %s\n%s\n" % (seq_feature.qualifiers['locus_tag'][0],seq_record.name,seq_feature.qualifiers['translation'][0]))output_handle.close()
input_handle.close()
参考官方手册
biopython:基因genbank格式转核酸或氨基酸fasta格式相关推荐
- 文件格式——fasta格式
fasta格式 在生物信息学中,FASTA格式(又称为Pearson格式),是一种基于文本用于表示核苷酸序列或氨基酸序列的格式.在这种格式中碱基对或氨基酸用单个字母来编码,且允许在序列前添加序列名及注 ...
- 生物信息数据格式:fasta格式
文章目录 格式说明 查看fasta 实例演练 读取fasta文件,并打印 把每条FASTA序列连成一行然后输出 把每条FASTA序列按一定长度输出 提取fasta.name中名字对应的test2.fa ...
- C#,生信软件实践(03)——DNA数据库GenBank格式详解及转为FASTA序列格式的源代码
1 GenBank 1.1 NCBI--美国国家生物技术信息中心(美国国立生物技术信息中心) NCBI(美国国立生物技术信息中心)是在NIH的国立医学图书馆(NLM)的一个分支.它的使命包括四项任务: ...
- 基因组序列genbank格式和fasta格式批量下载
from Bio import Entrez,SeqIO import csv# 参数设置 Entrez.email = "example@163.com" Entrez.tool ...
- linux系统fasta程序,fasta格式文件处理大全(一)
前面我们介绍了fastq格式文件的处理,大概有20多个案例,掌握了这些案例,后面拿到fastq格式之后就可以根据需求,使用合适的软件工具进行处理了,从这次内容开始,我们将逐渐介绍fasta格式文件的处 ...
- Fastq与Fasta格式
一.关于Fastq FASTQ是基于文本的,保存生物序列(通常是核酸序列)和其测序质量信息的标准格式.其序列以及质量信息都是使用一个ASCII字符标示,最初由Sanger开发,目的是将FASTA序列与 ...
- seurat读取文件的格式 10x文件内容 mtx格式scanpy.read_10x_mtx scanpy读取10x格式
使用scanpy读取10x In [5]: !ls barcodes.tsv.gz features.tsv.gz matrix.mtx.gzIn [6]: adata=sc.read_10x_mtx ...
- R语言使用gt包和gtExtras包优雅地、漂亮地显示表格数据:使用gtExtras包添加一个图,显示表中某一列中的数字、并自定义表格数据显示的主题格式、并自定义数值数据的格式(例如百分比)
R语言使用gt包和gtExtras包优雅地.漂亮地显示表格数据:使用gtExtras包添加一个图,显示表中某一列中的数字.并自定义表格数据显示的主题格式.并自定义数值数据的格式(例如百分比) 目录
- R语言配对图可视化:pivot_longer函数将宽格式的数据重塑为长格式并进行数据全连接和左连接(left join)、配对图可视化(根据分类变量的值为散点图上的数据点添加颜色)
R语言配对图可视化:pivot_longer函数将宽格式的数据重塑为长格式并进行数据全连接和左连接(left join).配对图可视化(根据分类变量的值为散点图上的数据点添加颜色,Add color ...
最新文章
- k8s控制器:Job和CronJob
- 谁更了解你,是女朋友吗。不,是这些推荐算法。
- 2021牛客暑期多校训练营6 :D Gambling Monster 期望dp + fwt + cdq分治
- 这份354页笔记的Android进阶知识+大厂高频面试题,绝对干货
- 用原生PHP做Blog系统-Day01
- sqlserver查看被锁表、解锁
- oracle parameterfile
- 解决GD中文乱码问题
- B树的原理以及C++实现(附源码和文档)
- ALSA驱动、设备函数调用关系
- 请描述osi七层模型,并简要概括各层功能
- 烽火狼烟丨PHP远程代码执行漏洞(CVE-2022-31625、CVE-2022-31626)风险提示
- correspondence analysis of drug and genotype(spss)
- 惠普打印机爆远程命令执行漏洞,黑客可任意操纵你的打印机
- R语言解决数据不平衡问题
- 小型机和PC服务器差异分析
- 马科维茨模型 matlab,马科维茨投资组合理论(均方模型)学习笔记——基于Matlab(四)...
- 云基础设施自研,阿里云腾讯云华为云亮出啥高招?
- android sqlite3设置密码,sqlite3 加密
- idea自动排版html,idea怎么格式化代码?