find、grep、sed、awk的使用

一、find
基本概念: find是一款文件搜索工具。

find /var/log 遍历log文件夹列出log下所有文件system.out.println()
find /var/log print0 整体显示，相当于java里的system.out.print()

find /var  -name  "*.log" 文件名匹配 实现支持通配符的精确匹配，会在/var目录下遍历匹配所有符合项
find /var  -path  "*m*/*.log" 路径匹配

多文件名匹配:

touch /var/{b,a,d,c,h}.log
find /var -name "[a-b,d-h].log" 匹配/var目录下[]内单个字符的log结尾的文件，可以看到c没有被匹配到
/var/b.log
/var/a.log
/var/d.log
/var/h.log

find /tmp -type f -name "h*.log" 搜索普通文件
find /tmp -type d -name "a*" 搜索文件夹

find /var -name "b.log" -exec ls -l  '{}' \; 找出模式匹配出的文件，并对其做操作
find /pass [option] "pattern" -exec command[option] '{}' \;

find /var/named/data -printf "%f\n"   获取去除路径前缀的basename
data
named.run-20190714
named.run-20190722
named.run-20190801
named.run-20190804
named.run

find /var/named/data ! -path /var/named/data 在搜索结果中去除/var/named/data本身这一项
不加！path的结果：find /var/named/data
/var/named/data
/var/named/data/named.run-20190714
/var/named/data/named.run-20190722
/var/named/data/named.run-20190801
/var/named/data/named.run-20190804
/var/named/data/named.run

find /var/named/data ! -path /var/named/data
/var/named/data/named.run-20190714
/var/named/data/named.run-20190722
/var/named/data/named.run-20190801
/var/named/data/named.run-20190804
/var/named/data/named.run

找出/var/log下7天前的日志并压缩存储在/work下，要求包名为当天日期

#!/bin/bash
mkdir /backf
find /var/log -mtime +7 -name "*.log" -type f -exec cp {} /backf/ \;
cd /work
tar -zcvP -f `date +%F`.tar.gz /backf
zip -r `date +%F`.zip /backf
rm -rf /backf

二、grep的用法
grep支持通配
常用方法：
1.grep "^####" zabbix_server.conf 匹配文件中指定匹配规则的字符串

[root@localhost test]# grep "^####" zabbix_server.conf
############ GENERAL PARAMETERS #################
############ ADVANCED PARAMETERS ################
####### LOADABLE MODULES #######
####### TLS-RELATED PARAMETERS #######

2.输出匹配行的前后几行
grep "^####" zabbix_server.conf -C 3
3.结合tr实现大小写字母转换

[root@localhost test]# grep "^####" zabbix_server.conf |tr [A-Z] [a-z]
############ general parameters #################
############ advanced parameters ################
####### loadable modules #######
####### tls-related parameters #######

4.实现既输出匹配路径又显示匹配结果

[root@localhost test]# grep 'mysql' /etc/passwd /dev/null
/etc/passwd:mysql:x:27:27:MariaDB Server:/var/lib/mysql:/sbin/nologin

5.[root@localhost test]# grep ":" zabbix_server.conf | cut -d : -f 2
cut的用法：
-d 以什么来分割
-f 取分割后的第几段
取出最后登录系统的用户信息

id `who | cut -d' ' -f1 | tail -1`

6.正则表达式回文结构12321/zabaz
grep -w -e '(.)(.).\2\1' file

7.grep -E 扩展正则表达式
grep -E 'l{1,2}' zabbix_server.conf
匹配文件中l字母最小连续出现1次，最多连续出现2次

grep选项：
-i：忽略字符的大小写
-o：仅显示匹配到的字符串本身
-v：显示不被模式匹配到的行
-E：支持使用扩展的正则表达式
-C #：显示被模式匹配的行及其前后各#行（A前B后）

正则表达式：
grep正则表达式元字符
　　‘^‘： 锚定行首

　　‘$’： 锚定行尾 

　　‘.‘： 匹配任一一个字符

　　‘*’： 匹配零个或多个先前字符 

　　‘\?‘：匹配其前面的字符0次或者1次；

　　‘\+’：匹配其前面的字符1次或者多次；

　　‘\{m\}‘：匹配其前面的字符m次（\为转义字符）

　　‘\{m,n\}’：匹配其前面的字符至少m次，至多n次

　　‘[]‘： 匹配一个指定范围内的字符 | ‘[^]’匹配指定范围外的任意单个字符

　　‘\<‘或‘\b’：锚定词首，‘\>’或‘\b’：锚定词尾（可用\<PATTERN\>：匹配完整单词）

　　‘\(\)’：将多个字符当做一个整体进行处理

　　后向引用：引用前面的分组括号中的模式所匹配到的字符

　　分组括号中的模式匹配到的内容或被正则表达式引擎自动记录于内部的变量中：

　　\1：模式从左侧起，第一个左括号及与之匹配的右括号之间模式匹配到的内容

　　\2：模式从左侧起，第二个左括号及与之匹配的右括号之间模式匹配到的内容...

　　扩展正则表达式与正则表达式略有不同：

　　'[]'：依旧匹配指定范围内的任意单个字符；但是有很多特殊匹配方式。

　　　　[:digit:] 匹配任意单个数字

　　　　[:lower:] 匹配任意单个小写字母               

　　　　[:upper:] 匹配任意单个大写字母

　　　　[:alpha:] 匹配任意单个字母

　　　　[:alnum:] 匹配任意单个字母或数字

　　　　[:punct:] 匹配任意单个符号

　　　　[:space:] 匹配单个空格

　　一些地方取消了转义字符的使用：

　　‘?‘：匹配其前面的字符0次或者1次；

　　‘+’：匹配其前面的字符1次或者多次；

　　‘{m}‘：匹配其前面的字符m次（\为转义字符）

　　‘{m,n}’：匹配其前面的字符至少m次，至多n次

　　()：将一个或多个字符捆绑在一起，当做一个整体进行处理，反向引用照常使用。

　　‘|’：或（注：‘C|cat’为C与cat，‘（C|c）at才是Cat与cat’）

egrp表达式
.： 匹配任意单个字符；
[]： 匹配指定范围内的任意单个字符
[^]：匹配指定范围外的任意单个字符
[:digit:] [:lower:] [:upper:] [:alpha:] [:alnum:] [:punct:] [:space:]

* ：匹配前面的字符任意次，包括0次
.* ：任意长度的任意字符
? ：匹配其前面的字符0或1次
+ ：匹配其前面的字符至少1次
{m} ：匹配前面的字符m次
{m,n} ：匹配前面的字符至少m次，至多n次
{,n} ：匹配前面的字符至多n次
<=n次
{m,} ：匹配前面的字符至少m次
>=m次 　　

^ ：行首锚定
$ ：行尾锚定
^PATTERN$: 用于模式匹配整行
^$: 空行
^[[:space:]]*$ ：空白行或包含tab字符的行
\< 或 \b ：词首锚定
\> 或 \b ：词尾锚定
    注意：在grep中，字母和数字的组合也被视为单词
\<PATTERN\>：锚定以PATTERN表达式做为单词的行

()：括号内模式会被记录于正则表达式引擎中：
后向引用：\1，\2，\3......
或者
a|b：a或者b
　　eg：C|cat ：表示C或者cat
　　　　(C|c)at ：表示Cat或者cat

------------------------------------------------------------------------------------------------------------三、sed的用法
sed [options] script filename

工作流程:

image.png

引用图片地址：https://blog.51cto.com/13691477/2113132

上图所示过程读取文件到模式空间--->匹配模式空间文件里一行内容--->匹配成功执行输出或执行sed '{cmd1;cmd2;cmd3}' /filepath---->执行成功丢弃或没匹配上丢弃，读取模式空间下一行

script可以是脚本或地址定界
地址定界 sed ‘/pattern编辑命令/’ /filepath

选项：
-n:不输出模式空间里的内容，仅输出匹配到的内容
-e:多个script
-f:从指定文件中读取编辑脚本
编辑命令:
p:不输出模式空间里的内容
d:删除
$:最后一行
1.sed -n '1,3p' /etc/passwd
匹配第1行至第三行不输出模式空间里的内容

2.匹配root开头的行
sed -n '/^root/'p /etc/passwd

3.多点编辑
sed -e 's@^#[[:space:]]*@@' -e '/^UUID/d' /etc/fstab

4.从指定文件中读取编辑脚本
写入脚本 echo "1,3p" > sed_sh.txt
sed -n -f sed_sh.txt /etc/passwd

5.$的使用
sed -n '$p' /etc/passwd

6.#,+#用法
第二行行后面加五行 sed -n '2,+5p' /etc/passwd

7.双pattern模式
从pat1模式匹配到的行至pat2匹配到的行

sed -n '/^sshd/,/^apache/p' /etc/passwd

s/ 要替换的字符/替换成的字符/标记：查找替换，其分隔符可自行指定，常用的有s@@@, s###
替换标记：
g：全局替换；
w /PATH/TO/SOMEFILE：将替换成功的结果保存至指定文件中；
p：显示替换成功的行；

四、awk的用法
awk [option] 'pattern{commend}' /filepass

option:
-F: 对文件的行做切割
-v：定义变量
其中$1,$2....表示切割后的第几个字符串，$0表示整行
print多个字符串时用逗号隔开，输出的结果以空格分隔。
1.awk '{print $1,$2,$3}' /etc/fstab 输出/etc/fstab的第1,2,3字段，默认空格为分隔符

2.awk -F ':' '$7 == "/bin/bash"{print "你好:",$1,"你的shell是:",$7}' /etc/passwd
在'{}' 中字符串用" "。
你好:  root  你的shell是:  /bin/bash

3.awk -F ':' '$7 == "/bin/bash"{print "who use bash:",$1}' /etc/passwd
who use bash: root

4.awk中想用系统命令
awk '{system("echo 你好")}' /etc/passwd

5.awk的内建变量
FS:输入时的分隔符 相当于 awk -F
OFS:输出时的分隔符
awk -v FS=':' -v OFS=' ' '{print $1,$2}' /etc/passwd

root x
bin x
daemon x
adm x
lp x


RS:输入时的换行符
ORS:输出时的换行符
NF:字段数量
NR:行数
FILENAME:文件名


awk '{system(NF "echo 你好")}' /etc/passwd
输出效果是每输出一次你好同时输出一行的字符串个数
反过来输出的话如下:
awk '{printf NF;system("echo 你好")}' /etc/passwd

6.自定义变量及BEGIN和END

begin读取前执行，end所有读完后执行
'BGEIN{ACTIONS}PATTERN{ACTIONS}END{ACTIONS}'
awk -v test="hello gawk" 'BEGIN{print test}'
hello gawk

7.printf的format及条件表达式:条件?为真的操作:为假的操作

判断所有用户是否是root用户
printf后%-15s是格式符，表示向左15个字符 %-s是显示字符串并左对齐 %+s显示字符串并右对齐 
awk -F ':' '{$3>=1000?usertype="普通用户":usertype="root用户";printf "%-15s:%-15s\n",$1,usertype}' /etc/passwd

mysql          :root用户         
fedora         :普通用户           
systemd-network:root用户         
centos         :普通用户

8.awk支持函数调用和条件语句

fuction_name(arg1,arg2,...)
条件语句和java一样
有一个for循环不一样，遍历数组
for(var in array){body}
#取出iphone、android后到null之间的值
cat test.txt
7.11 iphone to%2FmjWjG7Z8Z%2B8PGfZz7TmuFR0mBWiiUEg%3D NULL
android IZWzM%2FKZxGcaaY C9hhaGtS6NAafdjDIr8KySNgg6O NULL
0.99 1212 iphone 你好，请问你叫什么名，哪%d里字/t人，姓什么叫什么啊 NULL
android 你好，%f请问你叫什么名，哪%d里字/t人，姓什么叫什么啊 NULL

[root@localhost 桌面]# awk '{for(i=1;i<=NF;i++){if($i=="android" || $i=="iphone"){printf("%s\n",$(i+1));break}}}' test.txt
to%2FmjWjG7Z8Z%2B8PGfZz7TmuFR0mBWiiUEg%3D
IZWzM%2FKZxGcaaY
你好，请问你叫什么名，哪%d里字/t人，姓什么叫什么啊
你好，%f请问你叫什么名，哪%d里字/t人，姓什么叫什么啊

9.引用于骏马金龙博客点击进入

[root@localhost 桌面]# var=str && awk -v var="$var" 'BEGIN{print var}'
str
awk 'BEGIN{}PATTERN{print var1,var2,var3}' var1=value1 var2=value2 file1 var3=value3 var1=value4 file2

在上面的语句中，var123不能在BEGIN{}中使用,当awk执行完BEGIN程序后，准备读取主输入，于是开始解析program后的输入文件。解析时发现，var1和var2都是赋值语句，于是当成变量处理，当读取到file1时，发现只有一个参数，则当作输入文件，于是开始处理该文件。在处理file1时，var1和var2都是有效的，但var3还未赋值，因此var3无效。当处理完file1后，继续解析下一个主输入文件，此时var3被赋值，并开始处理file2。在处理file2时，var1、var2和var3都是有效的，但var1被新值覆盖