grep
image.png
只要出现gene字眼都查找出
image.png
精确查找,一个单词一个单词的搜索
image.png
image.png
image.png
用于找文件前缀
到file文件里面查找关键词
grep -w -f file
image.png
-n显示行号
正则表达式
image.png
image.png
-
只查找以“T”开头的行
-
模糊匹配的方法 f*ee
image.png grep 'f?ee' 其中 \是转义符
表示f可以出现0次或1次, 查找fee 或者ee- 匹配1次或多次
grep 're+'
表示e可以出现1次或多次,查找 ree, re, ree等
- 匹配1次或多次
-
{n}匹配n次
image.png
-
列出以*结尾的文件
image.png 一般情况下*可以当做通配符
-
*表示出现0次或者1次
image.png
sed
image.png
image.png
image.png
a命令.png
在第一行和第二行前面加一行.png
image.png
image.png
image.png
image.png
image.png
image.png
image.png
image.png
1,练习题目
image.png
image.png
从第二行开始,使用y函数,ATCG对应TAGC,如果想要保存,利用重定向命令
awk
awk定义
image.png
image.png
image.png
循环语句
image.png
image.png
先匹配外显子的exon的行,第五列减去第四列
当用cut命令取第九列的时候,取得很多
image.png
基因前后的空格都被分割了,取出来
所以需要重新定义分隔符
-F分隔符被重新定义为制表符
打印关于UTR的所有列出来
print和print end 类似于在开头结尾加注释
image.png
image.png