genbank to fasta 核酸

from Bio import SeqIO
gbk_filename = "c00079_GUT_GEN...region001.gbk"
faa_filename = "c00079_GUT_GEN...region001.fna"
input_handle  = open(gbk_filename, "r")
output_handle = open(faa_filename, "w")for seq_record in SeqIO.parse(input_handle, "genbank") :print("Dealing with GenBank record %s" % seq_record.id)output_handle.write(">%s %s\n%s\n" % (seq_record.id,seq_record.description,seq_record.seq))output_handle.close()
input_handle.close()

genbank to fasta 氨基酸

from Bio import SeqIO
gbk_filename = "NC_005213.gbk"
faa_filename = "NC_005213_converted.faa"
input_handle  = open(gbk_filename, "r")
output_handle = open(faa_filename, "w")for seq_record in SeqIO.parse(input_handle, "genbank") :print("Dealing with GenBank record %s" % seq_record.id)for seq_feature in seq_record.features :if seq_feature.type=="CDS" :assert len(seq_feature.qualifiers['translation'])==1output_handle.write(">%s from %s\n%s\n" % (seq_feature.qualifiers['locus_tag'][0],seq_record.name,seq_feature.qualifiers['translation'][0]))output_handle.close()
input_handle.close()

参考官方手册

biopython:基因genbank格式转核酸或氨基酸fasta格式相关推荐

  1. 文件格式——fasta格式

    fasta格式 在生物信息学中,FASTA格式(又称为Pearson格式),是一种基于文本用于表示核苷酸序列或氨基酸序列的格式.在这种格式中碱基对或氨基酸用单个字母来编码,且允许在序列前添加序列名及注 ...

  2. 生物信息数据格式:fasta格式

    文章目录 格式说明 查看fasta 实例演练 读取fasta文件,并打印 把每条FASTA序列连成一行然后输出 把每条FASTA序列按一定长度输出 提取fasta.name中名字对应的test2.fa ...

  3. C#,生信软件实践(03)——DNA数据库GenBank格式详解及转为FASTA序列格式的源代码

    1 GenBank 1.1 NCBI--美国国家生物技术信息中心(美国国立生物技术信息中心) NCBI(美国国立生物技术信息中心)是在NIH的国立医学图书馆(NLM)的一个分支.它的使命包括四项任务: ...

  4. 基因组序列genbank格式和fasta格式批量下载

    from Bio import Entrez,SeqIO import csv# 参数设置 Entrez.email = "example@163.com" Entrez.tool ...

  5. linux系统fasta程序,fasta格式文件处理大全(一)

    前面我们介绍了fastq格式文件的处理,大概有20多个案例,掌握了这些案例,后面拿到fastq格式之后就可以根据需求,使用合适的软件工具进行处理了,从这次内容开始,我们将逐渐介绍fasta格式文件的处 ...

  6. Fastq与Fasta格式

    一.关于Fastq FASTQ是基于文本的,保存生物序列(通常是核酸序列)和其测序质量信息的标准格式.其序列以及质量信息都是使用一个ASCII字符标示,最初由Sanger开发,目的是将FASTA序列与 ...

  7. seurat读取文件的格式 10x文件内容 mtx格式scanpy.read_10x_mtx scanpy读取10x格式

    使用scanpy读取10x In [5]: !ls barcodes.tsv.gz features.tsv.gz matrix.mtx.gzIn [6]: adata=sc.read_10x_mtx ...

  8. R语言使用gt包和gtExtras包优雅地、漂亮地显示表格数据:使用gtExtras包添加一个图,显示表中某一列中的数字、并自定义表格数据显示的主题格式、并自定义数值数据的格式(例如百分比)

    R语言使用gt包和gtExtras包优雅地.漂亮地显示表格数据:使用gtExtras包添加一个图,显示表中某一列中的数字.并自定义表格数据显示的主题格式.并自定义数值数据的格式(例如百分比) 目录

  9. R语言配对图可视化:pivot_longer函数将宽格式的数据重塑为长格式并进行数据全连接和左连接(left join)、配对图可视化(根据分类变量的值为散点图上的数据点添加颜色)

    R语言配对图可视化:pivot_longer函数将宽格式的数据重塑为长格式并进行数据全连接和左连接(left join).配对图可视化(根据分类变量的值为散点图上的数据点添加颜色,Add color ...

最新文章

  1. k8s控制器:Job和CronJob
  2. 谁更了解你,是女朋友吗。不,是这些推荐算法。
  3. 2021牛客暑期多校训练营6 :D Gambling Monster 期望dp + fwt + cdq分治
  4. 这份354页笔记的Android进阶知识+大厂高频面试题,绝对干货
  5. 用原生PHP做Blog系统-Day01
  6. sqlserver查看被锁表、解锁
  7. oracle parameterfile
  8. 解决GD中文乱码问题
  9. B树的原理以及C++实现(附源码和文档)
  10. ALSA驱动、设备函数调用关系
  11. 请描述osi七层模型,并简要概括各层功能
  12. 烽火狼烟丨PHP远程代码执行漏洞(CVE-2022-31625、CVE-2022-31626)风险提示
  13. correspondence analysis of drug and genotype(spss)
  14. 惠普打印机爆远程命令执行漏洞,黑客可任意操纵你的打印机
  15. R语言解决数据不平衡问题
  16. 小型机和PC服务器差异分析
  17. 马科维茨模型 matlab,马科维茨投资组合理论(均方模型)学习笔记——基于Matlab(四)...
  18. 云基础设施自研,阿里云腾讯云华为云亮出啥高招?
  19. android sqlite3设置密码,sqlite3 加密
  20. idea自动排版html,idea怎么格式化代码?

热门文章

  1. 黑苹果热补丁hotpatch来禁用笔记本独显
  2. 01、【江科大自化协stm32F103c8t6】笔记之【入门32单片机及GPIO初始化参数配置】
  3. 阿里巴巴微服务架构演进
  4. 开发者出海跨境收款——如何完美解决限额问题?
  5. VSCode快捷键配置复制一行
  6. UNI-APP,推广二维码页面实现
  7. 设计模式随笔-锦囊妙计
  8. 阿里云,DNS(云解析),封装类
  9. Surface Pro4 分辨率1分2 调整为1368*912
  10. 第十二届前端搞可视化部分笔记