准备文件:

hg19ToHg38.over.chain.gz
hg38ToHg19.over.chain.gzGRCh37_to_GRCh38.chain.gz
GRCh37_to_GRCh38.chain.gz

下载网页打开很慢,已经放到百度云盘

链接:https://pan.baidu.com/s/1CGQ4TtaibfiMPlkFXSD4yQ
提取码:oqkd

1. bed 文件 hg19转hg38 (GRCH同理)

工具:liftover

liftover只能处理bed格式

liftOver input_hg19.bed  hg19ToHg38.over.chain.gz output_hg38.bed unmap.bed

2. vcf文件 GRCH37转GRCH38

工具:vcf-liftover

本质上是调用liftover,速度很快

更正:这个出来的结果并不是标准的vcf格式,作者的代码有问题,后续处理这个vcf文件的时候会有错误

github链接:https://github.com/liqg/vcf-liftover

zcat input.vcf.gz | ~/vcf-liftover GRCh37_to_GRCh38.chain.gz | bgzip -c > output.vcf.gz

3.picard GRCH37转GRCH38

需要加载参考基因组,速度慢,版本选择2.13以上,低版本不支持转38版本

##picard 建立参考基因组索引

java -jar ~/picard.jar CreateSequenceDictionary \R= ~/GRCH38/Homo_sapiens.GRCh38.97.dna.primary_assembly.fa O= ~/GRCH38/Homo_sapiens.GRCh38.97.dna.primary_assembly.dict

## picard 转换坐标

java -jar ~/software/picard.jar LiftoverVcf I= input.vcf.gz  O= output.vcf.gz \CHAIN= ~/GRCh37_to_GRCh38.chain.gz  REJECT=unmap_rejected_variants.vcf R=~/GRCH38/Homo_sapiens.GRCh38.97.dna.primary_assembly.fa

bed vcf 文件 GRCH37转 GRCH38 hg19 转hg38相关推荐

  1. java vcf文件 昵称怎么写_Annovar注释vcf-笔记

    找了突变,获得了snp的vcf文件,肯定想知道这些突变位点到底是出现在哪些基因上以及那些转录本上:如果是出现在外显子上的突变,想了解这些突变会对编码蛋白造成怎么样的影响,这些统统能用annovar解决 ...

  2. 如何判断基因组的重复区域_人类参考基因组GRCh37 VS GRCh38

    人类基因组包括22条常染色体(1-22),2条性染色体(X,Y)和线粒体DNA(mtDNA).高通量测序的reads比对至参考基因组是后续数据分析的基础.因此,参考基因组的质量是至关重要的.目前,广泛 ...

  3. 做研究用hg19还是hg38基因组?一行代码将hg19的bw文件转成hg38

    有没有想过这个问题:做研究的时候该用hg19还是hg38基因组? 人类基因组版本现状 对于同一个物种 ,数据库中存在不同的基因组版本,以人类( Homo Sapiens )为例,U CSC基因组浏览器 ...

  4. 利用snpEff对基因型VCF文件进行变异注释的详细方法

    利用snpEff对VCF文件进行变异注释 群体遗传研究中,在获得SNP位点后,我们需要对SNP位点进行注释,对这些SNP位点进行更深的了解. snpEff是一个用于对基因组单核苷酸多态性(SNP)进行 ...

  5. pta通讯录排序用python实现,python实现将android手机通讯录vcf文件转化为csv

    经常会遇到将手机通讯录导出到电脑并转化为在电脑中可编辑的情况,在网上搜索了很久当前不外乎两种处理方式.1.使用电脑的outlook的通讯簿功能,将手机导出的vcf文件导入到outlook的通讯录中,然 ...

  6. python提取文本中的手机号_Python从vcf文件中读取手机号并进行去重操作

    文章目录 1. Python代码 file = open('test.vcf', 'r', encoding='utf-8') tels = [] for line in file: line = l ...

  7. python 处理snp的vcf文件,统计snp在基因的intron、exon还是上游、下游还是不在基因及基因附近

    1.c处理vcf文件,初步统计snp位置 位置信息有5种 down_stream是gene下游2k以内,up_stream 是gene上游2k以内,gene_exon是snp在外显子内,gene_in ...

  8. 2021.06.08|提取、比较各样品vcf文件中snp突变频率

    目录 摘要 环境与方法 使用代码 分析结果 总结 摘要 接到一个wgs项目,要帮助客户统计vcf文件中snp突变频率,比较两个样品的突变位点.这个工作在上一个项目中是手动处理的,当时参考序列短,突变位 ...

  9. R语言丨根据VCF文件自动填充对其变异位点并生成序列fa文件

    根据VCF文件自动填充对其变异位点并生成序列fa文件 首先提出一个问题: 假如有一个重测序结果VCF文件,里面包含了很多个样本在几百个突变位点(snp和iad)的基因型数据,现在想根据这份原始数据,得 ...

最新文章

  1. latex中的引用命令\citep{}和\citet{}
  2. OpenFlow Switch — 1.3 规范
  3. Linux下CMake简明教程
  4. uniapp H5页面嵌入微信小程序 ios 下 video组件 播放视频 设置 border-radius overflow:hidden 不生效
  5. Eclipse公共许可证
  6. SQL Server 批量更新字段值为ROW_NUMBER()+列名称
  7. 程序员里面开源_如何以开源程序员的身份开始
  8. 【元胞自动机】基于matlab元胞自动机模拟SEIR传播模型【含Matlab源码 2156期】
  9. 鲍威尔法c语言程序求方程,鲍威尔法C源程序.doc
  10. win10 隐藏图标
  11. 局域网同步服务器系统时间,局域网中如何设置系统时间与服务器同步
  12. 获取ua(user Agent)
  13. 【诗词】八声甘州·摘青梅荐酒 (羡青山有思,白鹤忘机。)
  14. 修改材质球面板shader属性数值
  15. python切片是什么意思_python中的切片是什么?(实例解析)
  16. 大学生极速成长系列教程—7.IT类大学生如何打造个人品牌
  17. #离散#ssl 1747 登山机器人问题
  18. kurento 6.6.0 安装部署 + 运行官网demo
  19. 【MEMO】Linux常用命令行
  20. 案例2:百度地图api-覆盖物项目

热门文章

  1. 希捷和西数移动硬盘哪个好_西数和希捷的硬盘哪个好看完存储数据一目了然
  2. div的横向与纵向排列
  3. 推荐一部小说《亵渎》
  4. 【Axure高保真原型】柱状-折线组合图表原型模板
  5. Python 1-22 测试
  6. 火车头采集表格数据,高效准确!
  7. iOS AVplayer 基本使用方法
  8. Zephyr应用笔记:mcuboot引导zephyr镜像
  9. Perfetto —— 靠谱的trace利器
  10. 机试指南 cha3 哈夫曼