序列比对

定义

序列比对(alignment):运用特定的算法找出两个或多个序列之间产生最大相似度得分的空格(空位)插入或序列排列方案。

分类

  • 多序列比对:两条以上序列的序列比对
  • 双序列比对:分为全局比对和局部比对
  • 全局比对:用于比较两个长度近似的序列,常用Needleman-Wunsch算法
  • 局部比对:用于比较一长一短两条序列

用途

  • 确定:一个未知序列是否属于某个家族
  • 建立:系统发生树,查看物种间或序列序列间的关系
  • 模式识别:一些特别保守的序列片段往往对应重要的功能区域,通过多序列比对,可以找到这些保守片段
  • 已知推未知:把已知有特殊功能的序列片段通过多序列比对做成模型,然后根据模型推测未知的片段序列是否也具有功能
  • 其他:预测蛋白质/RNA二级结构
## 比较COVID19与SARS、MERS序列的相似性
from Bio import SeqIO
## 数据来源:GenBank
## https://www.ncbi.nlm.nih.gov/nuccore/NC_045512
covid = SeqIO.read("covid19.fasta", "fasta")
covid

SeqRecord(seq=Seq(‘ATTAAAGGTTTATACCTTCCCAGGTAACAAACCAACCAACTTTCGATCTCTTGT…AAA’), id=‘NC_045512.2’, name=‘NC_045512.2’, description=‘NC_045512.2 Severe acute respiratory syndrome coronavirus 2 isolate Wuhan-Hu-1, complete genome’, dbxrefs=[])

sars = SeqIO.read("sars.fasta", "fasta")
mers = SeqIO.read("mers.fasta", "fasta")
from Bio import Align
## 算法:
# 比较两序列对应碱基是否相同
# 相同得1,不同得0
# 通过插入空位,使得分最高,获得全局比对
aligner = Align.PairwiseAligner()
## 用一个简单例子做试验
alignments = aligner.align('ATCT', 'ATCG')
## 打印得分最高的所有结果
for alignment in alignments:print(alignment)

ATCT-
|||–
ATC-G

ATC-T
|||–
ATCG-

ATCT
|||.
ATCG

## 这里只用到得分
mers_score = aligner.score(covid.seq, mers.seq)
sars_score = aligner.score(covid.seq, sars.seq)
## 在这种算法的基础上,满分即序列长度
mers_similarity = mers_score / len(covid)
sars_similarity = sars_score / len(covid)
print('名称\t相似度')
print('MERS\t%.2f' % mers_similarity)
print('SARS\t%.2f' % sars_similarity)

名称 相似度
MERS 0.70
SARS 0.83

使用Biopython比较基因组相似度:新冠(COVID19)与非典(SARS)、中东呼吸综合征(MERS)相关推荐

  1. 中科院遗传所钱文峰组发表新冠病毒源于自然界的科学证据

    导 读 肆虐全球的新冠病毒是否起源于自然界是目前国际上的一个争议热点.由于科学家们尚未从野生动物中成功分离得到与新冠病毒足够相似的病毒,因此,实验室起源的可能性被反复提及.本研究通过对新冠病毒基因组突 ...

  2. 阳康后是否二次感染,长新冠与肠道菌群的关联,多种潜在的干预措施

    谷禾健康 随着大家陆续"阳康",大家逐渐恢复以往的生活,城市的烟火气回来了. 然而阳康后真的万事大吉了吗? 还是有很多朋友处于这样的状态:感觉恢复了,又好像没有完全恢复,身体多少有 ...

  3. Genome Research | 呼吸疾病国家重点实验室华大研究院合作解析新冠轻重症患者血浆cfRNA特征谱...

    2022年1月21日,广州医科大学呼吸疾病国家重点实验室赵金存教授团队与深圳华大生命科学研究院(下简称"华大研究院")联合科研团队在国际著名学术杂志Genome Research ...

  4. 【无标题】新冠病毒变异株检测——荧光定量PCR检测技术开发

    一.新冠病毒简介 2019新型冠状病毒(2019-nCoV,世卫组织2020年1月命名:SARS-CoV-2,国际病毒分类委员会2020年2月11日命名)简称"新冠". 冠状病毒是 ...

  5. Cell:无症状新冠患者阳性持续105天

    此前有研究显示,大多数SARS-CoV-2感染患者在大约8天内表现出比较强的传染性,但人与人之间存在很大的差异,尤其免疫力低下人群或有不同表现.11月4日,顶级学术期刊<细胞>(Cell) ...

  6. 阿里云高效基因序列检索助力新冠肺炎病毒序列快速分析

    简介: 阿里云高效基因序列检索助力新冠肺炎病毒序列快速分析 AnalyticDB for MySQL是云端托管的PB级高并发低延时数据仓库,通过AnalyticDB for MySQL向量检索功能构建 ...

  7. 为什么新冠德尔塔毒株如此“危险”?

    NEW 关注剁手日记视频号 最新视频→[OPPO下一代屏下镜头技术:这可能才是你想要的全面屏] 来源|虎嗅医疗组 文|苏北佛楼蜜 题图|视觉中国 疫情正还在整治中等待收束,如今我们已经清楚,让南京机场 ...

  8. 柳絮会携带新冠病毒?这些新冠谣言别信!

    柳絮会携带新冠病毒?这些新冠谣言别信! 2020-04-18 09:44:23 来源: 人民网 关注新华网 微信 微博 Qzone 0 评论 编者按:春暖花开,漫天飞舞的柳絮会携带新冠病毒,导致跨区域 ...

  9. 美通企业周刊 | 联行科技与保时捷中国达成充电合作;默克推进新冠疫苗制造平台;蔡司上半财年业绩良好...

    一周企业资讯看点:联行科技强化保时捷中国充电服务.Shake Shack在上海虹桥机场开业,Gap首次在郑州和绍兴开店.赫兹国际租车亚洲业务一切正常.拉加代尔体育与娱乐公司更名为SPORTFIVE,1 ...

最新文章

  1. 华理c语言设计网上作业,华东理工大学第一学年第二学期网上作业参考答案C语言设计1...
  2. (hibernate之三)session的delete方法
  3. SSM整合activiti框架
  4. java spring流程_浅谈SpringMVC执行过程
  5. (十三) 深入浅出TCPIP之setsockopt参数详解
  6. 11.标识符_unicode和GBK_各种字符集的关系
  7. Django连接现有mysql数据库
  8. python二维列表的展开_python将三维数组展开成二维数组的实现
  9. Struts2工作流程
  10. SEO关键词优化:如何理解被百度快速索引?
  11. 性能测试指标(重要)
  12. AutoCADDCL对话框设计示例八
  13. 用云来实现主机效率的最大化 CSC这家公司是怎么做的?
  14. 利用GitHub搭建个人网站
  15. APP创业经:比开发更难的是APP运营和推广
  16. 三、动态构建GStreamer管道
  17. Vue入门(Vue.js,库与框架,MVVM,BootCDN,Vue入门,数据双向绑定,vue事件,生命周期,钩子函数 )
  18. 关于正月十六工作室更换新LOGO的通知
  19. androidStudio Lambda表达式的引入
  20. STATA面板数据模型进行Hausman检验

热门文章

  1. 好用的三维绘图软件CREO用来绘制圆角和倒角
  2. 认识LoRa以及LoRaWAN
  3. 【C语言笔记】【宏定义系列】 整数乘以分数
  4. AEAI Portal V3.5.2门户集成平台发版说明
  5. burp suite抓包教程
  6. linux apache http403,解决apache下http请求403 Forbidden错误
  7. java dto 实例_Spring Boot DTO示例:实体到DTO的转换
  8. openGauss认证@备考1
  9. html正方形裁剪成圆形,HTML5 Canvas 被圆形裁剪的马赛克
  10. 「战略」访谈录 | 聊聊领域驱动设计