编者按:

在金庸武学体系的众多武功之中,独孤九剑并不是最强劲的武功,它与其他武林绝学有很大的不同,可以说是鹤立鸡群。比如乔峰的降龙十八掌,段誉的六脉神剑,张无忌的九阳神功,石破天的罗汉伏魔神功,这些神功都需要强大的内力支撑,而独孤九剑则不同,不需要内力,这点其实可以从华山派气宗与剑宗的分歧就可以看出来。独孤九剑传人风清扬属于剑宗,更注重招式,而不是像剑宗注重练气。独孤九剑分为总诀式,破剑式,破刀式,破枪式,破鞭式,破索式,破箭式,破掌式,破气式,遇到不同的场景使用关不同的招式,因此,独孤九剑更加注重问题的解决,本质上就是就是通过工具来解决问题。只要学会这九剑,就可以处理很多的问题。学习生物信息也是同样的道理,当然练好内功,掌握很好的基础是非常必要的,但是也可以学习一些小工具,解决一些实际问题。那么从这次内容开始,我们就来给大家介绍生物信息之独孤九剑。

sed是linux下强大的文本编辑工具,sed全称是Stream EDitor,是一种流编辑器,什么是流编辑器呢。也就是相当于一个格式化的工具。当数据流过这个工具时,都被格式化成固定的格式。比如一个流水线中的一个模具,原材料是各种形状的,但是结果模具处理之后都变成同一的形状,这就是流编辑器。sed默认一次处理一行内容。处理时,把当前处理的行存储在临时缓冲区中,称为“模式空间”(pattern space),接着用sed命令处理缓冲区中的内容,处理完成后,把缓冲区的内容送往屏幕。接着处理下一行,这样不断重复,直到文件末尾。原文件内容并没有改变。sed主要用来自动编辑一个或多个文件,简化对文件的反复操作。而不需要编写转换程序来完成。

案例一:输出固定的行

sed -n ‘1307p’ seq.fna #输出文件第1307行;

sed -n ‘100,200’ seq.fna #输出文件第100到200行;

案例二:替换操作

sed -e ‘s/gi/GI/’ seq.fna #将文件中gi全部替换为大写GI;

sed -i ‘s/gi/GI/g’ seq.fna #在原文件上进行替换,并且进行全部替换;

sed -i.bak ‘s#GI#gi#’ seq.fna #在原文件上进行替换,并进行备份;

sed -e ‘s/gi/GI/2;s/ref/REF/2’ seq.fna #只将第二次出现的gi和ref进行替换;

sed -f sed.list cds.list #根据文件中的模式进行替换,可同时进行多条件替换;

sed -n ‘s/gi/GI/p’ seq.fna #打印发生替换的行;

案例三:删除空白行;

sed -e ‘/^\s*$/d’ seq.fna #删除文件中的空白行;

案例四:行寻址

sed -n ‘/ref/p’ seq.fna #输出文件中包含ref关键字的行;

sed ‘100,2000s/GI/gi/g’ seq.fa #则只替换100行到2000行的内容;

sed ‘100,2000!s/GI/gi/g’ seq.fa #加感叹号取反,在这个范围之外的执行操作;

案例五:删除操作

sed -e ‘/>/d’ seq.fna #删除包含ref的行;

sed -e ‘s/:.*//g’ seq.fna #删除冒号之后的所有内容;

案例六:对应替换,类似于tr的功能

sed -e ‘y/ATCG/atcg/’ seq.fna #修改大小写

sed -e ‘/>/!y/ATCG/atcg/’ seq.fna #DNA序列反向互补配对,并修改大小写

欢迎订阅微信公众号:基因学苑

生物信息之独孤九剑——sed相关推荐

  1. sed 替换_生物信息之独孤九剑——sed

    编者按: 在金庸武学体系的众多武功之中,独孤九剑并不是最强劲的武功,它与其他武林绝学有很大的不同,可以说是鹤立鸡群.比如乔峰的降龙十八掌,段誉的六脉神剑,张无忌的九阳神功,石破天的罗汉伏魔神功,这些神 ...

  2. 生物信息之独孤九剑——cut

    今年到目前写了不少内容,本来想写专题的,而且已经写了两个了,一共写了40篇.结果突然有一天发现,两年前写的一个专题还没有写完.本来要写一个生物信息之独孤九剑,结果只写了七篇,后来居然忘了继续更新,变成 ...

  3. 生物信息百Jia软件(七):glimmer

    编者按 欢迎关注微信公众号:基因学苑,更多精彩内容等你发掘! 前面写了专题<手把手教你生物信息分析平台搭建>,然后又介绍了很多<生物神奇网站>资源,也介绍了<生物信息之独 ...

  4. 生物信息百Jia软件(六):prodigal

    编者按 欢迎关注微信公众号:基因学苑,更多精彩内容等你发掘! 前面写了专题<手把手教你生物信息分析平台搭建>,然后又介绍了很多<生物神奇网站>资源,也介绍了<生物信息之独 ...

  5. 生物信息百Jia软件(十七):flash

    欢迎订阅WX众号:基因学苑,更多精彩内容等你发掘! 基因学苑Q群:32798724 编者按 前面写了专题<手把手教你生物信息分析平台搭建>,然后又介绍了很多<生物神奇网站>资源 ...

  6. 生物信息通识技术研讨会

    易生信系列课程 转录组,ChIP-seq,扩增子和宏基因组是从原始数据到分析结果的理论加实战型课程,课程安排内容饱满,时间紧张,是学习专业生信分析和解决实际问题的首选课程.这些课程适合零基础或者有一定 ...

  7. 你想要的生物信息知识全在这——生信宝典文章目录

    培训 生物信息作图系列R.Cytoscape及图形排版和Python编程培训研讨班开课了 120分的转录组考题,你能得多少 维密摔倒不可怕,关键时有人搀一把,坚持走下去 生物信息作图系列 - R.网络 ...

  8. 文件夹内的文本行数_重温生物信息重要的文本处理命令(实例命令及解释)

    linux文本处理命令是一类对文件进行操作的命令,通过使用文本处理命令,可以轻松的对文件进行排序,拆分,合并等操作,熟练掌握文本处理命令,在生物信息文本处理中,有十分重要的意义. 01 cat 查看文 ...

  9. 生物信息学习--nr/nt 数据库(总+子)构建

    1. 从ncbi上下载数据 下载地址:https://ftp.ncbi.nlm.nih.gov/blast/db/FASTA/ mac端: 安装brew,运行如下命令: /bin/zsh -c &qu ...

最新文章

  1. 数据库_数据库篇-第一章:数据库基本概念
  2. php的 each()用法,PHP each()用法及代码示例
  3. 国内外免费电子书(数学、算法、图像、深度学习、机器学习)
  4. cesium鼠标控制键盘_Cesium中级教程3 - Camera - 相机(摄像机)
  5. [2] ADB 基本用法
  6. eclipse插件开发:自定义导航器中的拖拽定义
  7. 基于MVC模式Struts框架研究
  8. git 创建webpack项目_从 0 开始构建 webpack 项目【Webpack Book 翻译】
  9. C语言实现链栈的创建、入栈、出栈、取栈顶、遍历......等基本操作(小白版详解)
  10. java 双三次线性插值_双线性及双三次插值
  11. Win7连接网络打印机步骤
  12. usb接口和计算机通信,USB接口是如何进行通信的?
  13. 博弈论完全信息博弈思维导图
  14. 质数的java代码_java 代码求质数
  15. 配置 manjaro
  16. Leco题目:两数相加
  17. Hadoop生态系统
  18. layui弄一个好看的数据表格样式
  19. 大白菜读取linux硬盘,大白菜的linux之旅,文件操作首探
  20. /etc/sysconfig/network-scripts 配置网卡

热门文章

  1. 电子类公司笔试题精选(zhuan)
  2. java 绘制角色_如何设计角色人物?角色人物绘制设计教程
  3. JAVA面向对象三大特征:
  4. Waymo称已拿到关键性证据,案件审讯或推迟
  5. 让盖泡面的iPad成为你的副屏
  6. Educoder----贪心法
  7. 3D美术职业晋级之路
  8. 计算机绘图是一种什么绘图,是指利用计算机上的什么进行美术创作过程.,改革的时代背景下、美术教育与信息教育整合...
  9. PFENet数据加载、训练、pascal5i不同的5类验证测试、添加训练曲线函数
  10. WIN10 AMD显卡驱动安装后 系统无法加载 解决方案