已知转录本test.ID,根据biomart包批量获得ensembl数据库中对应序列信息,并以fa格式输出
该方法需要魔法,我已进行了调试,可以成功运行
转录本test.ID样式(ENSMUST00000040608.4),以xlsx形式储存
![](/assets/blank.gif)
library(Biostrings)
library(biomaRt)
library(openxlsx)
library(seqinr)rm(list = ls())
genelist <- read.xlsx("待测基因testID汇总.xlsx")
genelist <- genelist$test_id
#移除genelist的小数点
genelist<-unlist(lapply(genelist, FUN = function(x) {return(strsplit(x, split = ".",fixed = T)[[1]][1])}))mart <- useMart("ensembl", dataset="mmusculus_gene_ensembl") # 小鼠的数据库
Ensemble_to_seq <- function(x) {cat("Getting sequence for gene", x, "\n") # 添加打印语句seq = biomaRt::getSequence(id = x, type = "ensembl_transcript_id", seqType = "cdna", mart = mart)seq<-as.data.frame(seq)seq$"Length"<-lapply(seq[,1],function(y){return(nchar(y))})return(seq)
}outTab <- data.frame()
for (i in genelist){outTab<-rbind(outTab,Ensemble_to_seq(i))} # 此步需要魔法# 保存为fa格式文件
for (i in 1:nrow(outTab)) {# 定义序列seq <- DNAStringSet(outTab$cdna[i])# 定义描述信息descr <- paste(outTab$ensembl_transcript_id[i], "length=", outTab1$Length[i], sep = "|")# 输出序列write.fasta(seq, names = outTab$ensembl_transcript_id[i], file.out = "output.fa", open = "a")
}
最后是输出结果展示
已知转录本test.ID,根据biomart包批量获得ensembl数据库中对应序列信息,并以fa格式输出相关推荐
- 1.已知本原多项式,利用Matlb中的simulink构成m序列产生器。2.已知任意本原多项式,利用matlb软件编程求解其对应的m序列以及m序列产生过程。
1. 已知本原多项式,利用Matlb中的simulink构成m序列产生器.2.已知任意本原多项式,利用matlb软件编程求解其对应的m序列以及m序列产生过程. m序列是最长线性反馈移位寄存器的简称,他 ...
- 已知三角形三边长怎么求面积_解三角形问题中的常见错解分析
解三角形问题是个难点,怎样才能突破这个难点呢? 只有正确理解三角形中的边角关系,即三角形中的边角等量关系.边角的不等关系及内角和关系,才能克服这个难点. 下面快和包sir一起对解三角形问题中的常见错误 ...
- mysql查询已知两列第三列,MySQL查询从两列中查找出现的次数?
使用MySQL GROUP_BY从两列中查找出现的次数.让我们首先创建一个表-mysql> create table DemoTable -> ( -> Name1 varchar( ...
- c语言已知一个班有10位同学,一个班10位同学参加期末c语言考试,先要输出全班同学的成绩,统计全班同学的平...
#include #define n 5 struct student { int num; char name[9]; float math; float english; float physic ...
- 爬取知网博硕士文献及中国专利存到mysql数据库中的代码及其注意事项
今天因为需要做了一个爬取知网博硕士论文及中国专利的爬虫,在制作的过程中遇到了不少坑,在网上查资料时都是很老的资源,在现在知网的反爬虫下不起作用,所以我来写这篇文章来供大家参考.(这篇文章主要介绍通过改 ...
- ensembl数据库BioMart使用,查找转录本ID在ensembl与refseq中的对应关系
如何查找 转录本ID在ensembl与refseq中的对应关系 Ensembl数据库地址: http://grch37.ensembl.org/index.html 进入BioMart 选择DataS ...
- jQuery九宫格跑马灯抽奖(已知结果)
描述: 写两个抽奖,等级不同,找到一个原生写法的,原作者链接如下: 参考( https://www.cnblogs.com/yangqing22/p/14065754.html ) 略改了一下,换成了 ...
- 已知空间一点到另外两点直线的距离
转自:http://www.cnblogs.com/clarkustb/archive/2008/11/04/1326500.html 已知空间一点到另外两点直线的距离 设空间中的三点为M1,M2,M ...
- Win7安装VC++6.0已知的兼容性问题的解决方法
转自:http://www.veryhuo.com/a/view/53057.html 今天写程序让人生气的是写的所有的程序没一个对的,不能连接运行.原来经过好多次的纠结后来才知道是win7不兼容导致 ...
最新文章
- 【Python-ML】神经网络-多层感知器增加梯度检验
- ML之API:国内外各大人工智能平台(百度云/华为云/阿里云/Face++等)及其API的简介、使用方法之详细攻略
- mathematica练习程序(图像取反)
- 【CF#801 A.】 Vicious Keyboard(字符串查找,水题)
- 请编写一个程序,用于统计字符串中每个字母的出现次数(字母忽略大小写),统计出结果后,请按照{'a':3,'b':2}的格式输出。
- 基础练习 Sine之舞 (递推)
- 7-11 分段计算居民水费 (10 分)
- springmvc处理器及前端控制器介绍
- 林业大学计算机专业排名2019,2019北京林业大学专业排名(4页)-原创力文档
- uPyLoader简易使用教程
- java js 汉字对应拼音码,五笔码转换
- java权限管理与用户角色权限设计
- SE5边缘计算盒子学习笔记-week1
- 面试篇-Spring 拦截器和过滤器的区别?
- scratch3.0探索000
- 【评测】牛血清白蛋白(BSA)篇
- js获取免费天气api
- 五种方法教你预防ddos攻击
- 使用idea构建父子类springboot项目教程,并教你启动子项目(构建项目集合)
- linux开机动画制作教程,Android开机画面制作(Bootloader阶段)
热门文章
- 描绘用户场景并将典型用户和用户场景描述
- 牛客 /acm/problem/13223 竞标赛
- MINA2.0 原理
- 权限完善、目视化清晰、简单实用文件管理系统,超实用文件管理系统,简单文件管理系统,文件管理平台,文件权限管理
- curl linux 测试接口_Linux测试端口的连通性的四种方法
- gentry算法_28个不得不看的经典编程算法
- Android Studio 选项菜单和动画结合_Android性能测试③-发现和定位内存泄露amp;卡顿...
- 多种方法助力小米(安卓)手机提升速度。
- int *p和int **p
- 关于icheck的使用