linux 的三驾马车grep ,sed,awk

grep

image.png

只要出现gene字眼都查找出


image.png

精确查找,一个单词一个单词的搜索


image.png
image.png
image.png

用于找文件前缀

到file文件里面查找关键词
grep -w -f file


image.png

-n显示行号

正则表达式


image.png
image.png
  • 只查找以“T”开头的行


  • 模糊匹配的方法 f*ee


    image.png
  • grep 'f?ee' 其中 \是转义符
    表示f可以出现0次或1次, 查找fee 或者ee

    • 匹配1次或多次
      grep 're+'
      表示e可以出现1次或多次,查找 ree, re, ree等
  • {n}匹配n次


    image.png
  • 列出以*结尾的文件


    image.png
  • 一般情况下*可以当做通配符

  • *表示出现0次或者1次


    image.png

sed

image.png

image.png
image.png

a命令.png

在第一行和第二行前面加一行.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

1,练习题目

image.png
image.png

从第二行开始,使用y函数,ATCG对应TAGC,如果想要保存,利用重定向命令

awk

awk定义

image.png
image.png
image.png

循环语句


image.png

image.png

先匹配外显子的exon的行,第五列减去第四列

当用cut命令取第九列的时候,取得很多

image.png

基因前后的空格都被分割了,取出来

所以需要重新定义分隔符

-F分隔符被重新定义为制表符

打印关于UTR的所有列出来


print和print end 类似于在开头结尾加注释


image.png
image.png

推荐阅读更多精彩内容