ainila 发表于 2018-8-22 07:14:22

shell基础二:查找技巧,find及xargs的使用

  Find命令
  由于f i n d具有强大的功能,所以它的选项也很多,其中大部分选项都值得我们花时间来了解一下。即使系统中含有网络文件系统(NFS),find命令在该文件系统中同样有效,只你具有相应的权限。在运行一个非常消耗资源的find命令时,很多人都倾向于把它放在后台执行,因为遍历一个大的文件系统可能会花费很长的时间(这里是指3 0 G字节以上的文件系统)。
  一.F i n d命令的一般形式为:
  find pathname -options [-print -exec -ok]
  pathname:find命令所查找的目录路径。例如用.来表示当前目录,用/来表示系统根目录。
  -print:    find命令将匹配的文件输出到标准输出。
  -exec:    find命令对匹配的文件执行该参数所给出的s h e l l命令。相应命令的形式为
  ' command' {} \;,注意{ }和\;之间的空格。
  -ok:      和-exec的作用相同,只不过以一种更为安全的模式来执行该参数所给出的
  s h e l l命令,在执行每一个命令之前,都会给出提示,让用户来确定是否执行。
  find命令选项
  -name:按照文件名查找文件。
  -perm:按照文件权限来查找文件。
  -prune:使用这一选项可以使f i n d命令不在当前指定的目录中查找,如果同时使用-depth选项,那么 -prune将被f i n d命令忽略。
  忽略/data/backu
  find /data/backup/ -path "/data/backup/log" -prune -o -print -type f -ok chmod o+x {} \;
  -user: 按照文件属主来查找文件。
  -group:按照文件所属的组来查找文件。
  -mtime -n +n:按照文件的更改时间来查找文件,- n表示文件更改时间距现在n天以内+n
  表示文件更改时间距现在n天以前。F i n d命令还有- a t i m e和- c t i m e选项,但它们
  都和- m t i m e选项。
  -nogroup:查找无有效所属组的文件,即该文件所属的组在/ e t c / g r o u p s中不存在。
  -nouser:查找无有效属主的文件,即该文件的属主在/ e t c / p a s s w d中不存在。
  -newer file1 ! file2:查找更改时间比文件f i l e 1新但比文件f i l e 2旧的文件。
  -type 查找某一类型的文件,诸如:
  b - 块设备文件。
  d - 目录。
  c - 字符设备文件。
  p - 管道文件。
  l - 符号链接文件。
  f - 普通文件
  -size n: 查找文件长度为n块的文件,带有c时表示文件长度以字节计。
  -depth:在查找文件时,首先查找当前目录中的文件,然后再在其子目录中查找。
  -fstype:查找位于某一类型文件系统中的文件,这些文件系统类型通常可以在配置文件/etc/fstab中找到,该配置文件中包含了本系统中有关文件系统的信息。
  -mount:在查找文件时不跨越文件系统m o u n t点。
  -follow:如果f i n d命令遇到符号链接文件,就跟踪至链接所指向的文件。
  -cpio:对匹配的文件使用c p i o命令,将这些文件备份到磁带设备中。
  实例:
  exec选项后面跟随着所要执行的命令或脚本,然后是一对儿{ },一个空格和一个\,最后是一个分号。
  为了使用exec选项,必须要同时使用p r i n t选项。如果验证一下find命令,会发现该命令只输出从当前路径起的相对路径及文件名。
  在/logs目录中查找更改时间在5日以前的文件并删除它们:
  find logs -type f -mtime +5 -exec rm {} \;
  在下面的例子中, f i n d命令在当前目录中查找所有文件名以. L O G结尾、更改时间在5日以上的文件,并删除它们,只不过在删除之前先给出提示。
  1. find . -name "*.conf"-mtime +5 -ok rm {} \;
  2. < rm ... ./conf/httpd.conf > ? n
  按y键删除文件,按n键不删除。
  在下面的例子中我们使用grep命令。find命令首先匹配所有文件名为“passwd*”的文件,例如passwd、passwd.old、passwd.bak,然后
  执行grep命令看看在这些文件中是否存在一个sam用户。
  1. find /etc -name &quot;passwd*&quot; -exec grep &quot;sam&quot; {} \;
  2. sam:x:501:501::/usr/sam:/bin/bash
  二.find 命令的例子
  为了在当前目录中文件属主具有读、写权限,并且文件所属组的用户和其他用户具有读权限的文件,可以用:
  find . -type f -perm 644 -exec ls -l {} \;
  为了查找系统中所有文件长度为0的普通文件,并列出它们的完整路径,可以用:
  find / -type f -size 0 -exec ls -l {} \;
  查找/var/logs目录中更改时间在7日以前的普通文件,并在删除之前询问它们:
  find /var/logs -type f -mtime +7 -ok rm {} \;
  为了查找系统中所有属于root组的文件,可以用:
  1. $find . -group root -exec ls -l {} \;
  2. -rw-r--r--    1 root   root          595 10月 31 01:09 ./fie1
  下面的find命令将删除当目录中访问时间在7日以来、含有数字后缀的admin.log文件。该命令只检查三位数字,所以相应文件的后缀不要超过 999。
  先建几个admin.log*的文件 ,才能使用下面这个命令
  1. $ find . -name &quot;admin.log&quot; -atime -7-ok
  2.rm {} \;
  3. < rm ... ./admin.log001 > ? n
  4. < rm ... ./admin.log002 > ? n
  5. < rm ... ./admin.log042 > ? n
  6. < rm ... ./admin.log942 > ? n
  为了查找当前文件系统中的所有目录并排序,可以用:
  1. $ find . -type d|sort
  find中的无错误输出的方式:
  find . -option optionName > /dev/null
  根据文件的特征查询方法:
  如果只知道某个文件的大小,修改日期等特征也可以使用“find”命令查找出来
  例如我们知道一个Linux文件大小为1,500 bytes,那么我们可是使用如下命令来查询find / -size 1500c,字符 c 表明这个要查找的文件的大小是以bytes为单位。如果我们连这个文件的具体大小都不知道,那么在Linux中还可以进行模糊查找方式来解决。例如我们输入find/ -size +10000000c 这个命令,则标明我们指定系统在根目录中查找出大于10000000字节的文件并显示出来。命令中的“+”是表示要求系统只列出大于指定大小的文件,而使用“-”则表示要求系统列出小于指定大小的文件。下面的列表就是在Linux使用不同“ find&quot;命令后系统所要作出的查找动作,从中我们很容易看出在Linux中使用“find&quot;命令的方式是很多的,“ find&quot;命令查找文件只要灵活应用,丝毫不必在WINDOWS中查找能力差。
  find / -amin -10 # 查找在系统中最后10分钟访问的文件
  find / -atime -2 # 查找在系统中最后48小时访问的文件
  find / -empty # 查找在系统中为空的文件或者文件夹
  find / -group cat # 查找在系统中属于 groupcat的文件
  find / -mmin -5 # 查找在系统中最后5分钟里修改过的文件
  find / -mtime -1 #查找在系统中最后24小时里修改过的文件
  find / -nouser #查找在系统中属于作废用户的文件
  find / -user fred #查找在系统中属于FRED这个用户的文件
  下面的列表就是对find命令所可以指定文件的特征进行查找的部分条件。在这里并没有列举所有的查找条件,参考有关Linux有关书籍可以知道所有 find命令的查找函数。
  -amin n
  查找系统中最后N分钟访问的文件
  -atime n
  查找系统中最后n*24小时访问的文件
  -cmin n
  查找系统中最后N分钟被改变状态的文件
  -ctime n
  查找系统中最后n*24小时被改变状态的文件
  -empty
  查找系统中空白的文件,或空白的文件目录,或目录中没有子目录的文件夹
  -false
  查找系统中总是错误的文件
  -fstype type
  查找系统中存在于指定文件系统的文件,例如:ext2 .
  -gid n
  查找系统中文件数字组 ID 为 n的文件
  -group gname
  查找系统中文件属于gnam文件组,并且指定组和ID的文件
  Find命令的控制选项说明:
  Find命令也提供给用户一些特有的选项来控制查找操作。下表就是我们总结出的最基本,最常用的find命令的控制选项及其用法。
  选项
  用途描述
  -daystart
  .测试系统从今天开始24小时以内的文件,用法类似 -amin
  -depth
  使用深度级别的查找过程方式,在某层指定目录中优先查找文件内容
  -follow
  遵循通配符链接方式查找; 另外,也可忽略通配符链接方式查询
  -help
  显示命令摘要
  -maxdepth levels
  在某个层次的目录中按照递减方法查找
  -mount
  不在文件系统目录中查找, 用法类似 -xdev.
  -noleaf
  禁止在非UNUX文件系统,MS-DOS系统,CD-ROM文件系统中进行最优化查找
  -version
  打印版本数字
  使用-follow选项后,find命令则遵循通配符链接方式进行查找,除非你指定这个选项,否则一般情况下find命令将忽略通配符链接方式进行文件查找。
  -maxdepth选项的作用就是限制find命令在目录中按照递减方式查找文件的时候搜索文件超过某个级别或者搜索过多的目录,这样导致查找速度变慢,查找花费的时间过多。例如,我们要在当前(.)目录技巧子目录中查找一个名叫fred的文件,我们可以使用如下命令
  find . -maxdepth 2 -name fred
  假如这个fred文件在./sub1/fred目录中,那么这个命令就会直接定位这个文件,查找很容易成功。假如,这个文件在./sub1/sub2 /fred目录中,那么这个命令就无法查找到。因为前面已经给find命令在目录中最大的查询目录级别为2,只能查找2层目录下的文件。这样做的目的就是为了让find命令更加精确的定位文件,如果你已经知道了某个文件大概所在的文件目录级数,那么加入-maxdepth n 就很快的能在指定目录中查找成功。
  使用混合查找方式查找文件
  find命令可以使用混合查找的方法,例如我们想在/tmp目录中查找大于100000000字节并且在48小时内修改的某个文件,我们可以使用-and 来把两个查找选项链接起来组合成一个混合的查找方式。
  find /tmp -size +10000000c -and -mtime +2
  学习过计算机语言的朋友都知道,在计算机语言里,使用and ,or 分别表示“与”和“或”的关系。在Linux系统的查找命令中一样通用。
  还有这样的例子,
  find / -user fred -or -user george
  我们可以解释为在/tmp目录中查找属于fred或者george这两个用户的文件。
  在find命令中还可以使用“非”的关系来查找文件,如果我们要在/tmp目录中查找所有不属于panda的文件,使用一个简单的
  find /tmp ! -user panda
  命令就可以解决了。很简单。
  文件信息的参数和使用方法
  选项
  用途描述
  -exec command;
  查找并执行命令
  -fprint file
  打印文件完整文件名
  -fprint0 file
  打印文件完整文件名包括空的文件
  -fprintf file format
  打印文件格式
  -ok command;
  给用户命令执行操作,根据用户的Y 确认输入执行
  -printf format
  打印文件格式
  -ls
  打印同种文件格式的文件.
三. 查找技巧,find及xargs的使用
  xargs
  在使用f i n d命令的- e x e c选项处理匹配到的文件时, f i n d命令将所有匹配到的文件一起传递给e x e c执行。但有些系统对能够传递给e x e c的命令长度有限制,这样在f i n d命令运行几分钟之后,就会出现溢出错误。错误信息通常是“参数列太长”或“参数列溢出”。这就是x a rg s命令的用处所在,特别是与f i n d命令一起使用。
  F i n d命令把匹配到的文件传递给x a rg s命令,而x a rg s命令每次只获取一部分文件而不是全部,不像- e x e c选项那样。这样它可以先处理最先获取的一部分文件,然后是下一批,并如此继续下去。
  在有些系统中,使用- e x e c选项会为处理每一个匹配到的文件而发起一个相应的进程,并非将匹配到的文件全部作为参数一次执行;这样在有些情况下就会出现进程过多,系统性能下降的问 题,因而效率不高;
  而使用x a rg s命令则只有一个进程。另外,在使用x a rg s命令时,究竟是一次获取所有的参数,还是分批取得参数,以及每一次获取参数的数目都会根据该命令的选项及系统内核中相应的可调参数来确定。
  来看看x a rg s命令是如何同f i n d命令一起使用的,并给出一些例子。
下面的例子查找系统中的每一个普通文件,然后使用x a rg s命令来测试它们分别属于哪类文件

[*]#find . -type f -print | xargs file
[*]./.kde/Autostart/Autorun.desktop: UTF-8 Unicode English text
[*]./.kde/Autostart/.directory:      ISO-8859 text\
[*]......

  在当前目录下查找所有用户具有读、写和执行权限的文件,并收回相应的写权限:

[*]
[*]# ls -l
[*]drwxrwxrwx    2 sam      adm          4096 10月 30 20:14 file6
[*]-rwxrwxrwx    2 sam      adm             0 10月 31 01:01 http3.conf
[*]-rwxrwxrwx    2 sam      adm             0 10月 31 01:01 httpd.conf
[*]
[*]# find . -perm -7 -print | xargs chmod o-w
[*]# ls -l
[*]drwxrwxr-x    2 sam      adm          4096 10月 30 20:14 file6
[*]-rwxrwxr-x    2 sam      adm             0 10月 31 01:01 http3.conf
[*]-rwxrwxr-x    2 sam      adm             0 10月 31 01:01 httpd.conf

  用g r e p命令在所有的普通文件中搜索hostname这个词:

[*]# find . -type f -print | xargs grep &quot;hostname&quot;
[*]./httpd1.conf:#   different IP addresses or hostnames and have them handled by the
[*]./httpd1.conf:# VirtualHost: If you want to maintain multiple domains/hostnames
[*]on your

  用g r e p命令在当前目录下的所有普通文件中搜索hostnames这个词:

[*]# find . -name \* -type f -print | xargs grep &quot;hostnames&quot;
[*]./httpd1.conf:#   different IP addresses or hostnames and have them handled by the
[*]./httpd1.conf:# VirtualHost: If you want to maintain multiple domains/hostnames
[*]on your
  注意,在上面的例子中, \用来取消f i n d命令中的*在s h e l l中的特殊含义。
下面是find一些常用参数的例子,有用到的时候查查就行了,像上面前几个贴子,都用到了其中的的一些参数,也可以用man或查看论坛里 其它贴子有find的命令手册
  1、使用name选项
  文件名选项是f i n d命令最常用的选项,要么单独使用该选项,要么和其他选项一起使用。
  可以使用某种文件名模式来匹配文件,记住要用引号将文件名模式引起来。
  不管当前路径是什么,如果想要在自己的根目录$ H O M E中查找文件名符合* . t x t的文件,使用~作 为' p a t h n a m e参数,波浪号~代表了你的$ H O M E目录。
  $ find ~ -name &quot;*.txt&quot; -print
  想要在当前目录及子目录中查找所有的‘ * . t x t’文件,可以用:
  $ find . -name &quot;*.txt&quot; -print
  想要的当前目录及子目录中查找文件名以一个大写字母开头的文件,可以用:
  $ find . -name &quot;*&quot; -print
  想要在/ e t c目录中查找文件名以h o s t开头的文件,可以用:
  $ find /etc -name &quot;host*&quot; -print
  想要查找$ H O M E目录中的文件,可以用:
  $ find ~ -name &quot;*&quot; -print 或find . -print
  要想让系统高负荷运行,就从根目录开始查找所有的文件。
  $ find / -name &quot;*&quot; -print
  如果想在当前目录查找文件名以两个小写字母开头,跟着是两个数字,最后是* . t x t的文件,下面的命令就能够返回名为a x 3 7 . t x t的文件:$
  $find . -name &quot;.txt&quot; -print
2、用perm选项
  按照文件权限模式用- p e r m选项。
  按文件权限模式来查找文件的话。最好使用八进制的权限表示法。
  如在当前目录下查找文件权限位为7 5 5的文件,即文件属主可以读、写、执行,其他用户可以读、执行的文件,可以用:

[*]$ find . -perm 755 -print
还有一种表达方法:在八进制数字前面要加一个横杠-,表示都匹配,如-007就相当于777,-006相当于666

[*]# ls -l
[*]-rwxrwxr-x    2 sam      adm             0 10月 31 01:01 http3.conf
[*]-rw-rw-rw-    1 sam      adm         34890 10月 31 00:57 httpd1.conf
[*]-rwxrwxr-x    2 sam      adm             0 10月 31 01:01 httpd.conf
[*]drw-rw-rw-    2 gem      group      4096 10月 26 19:48 sam
[*]-rw-rw-rw-    1 root   root         2792 10月 31 20:19 temp
[*]
[*]# find . -perm 006
[*]# find . -perm -006
[*]./sam
[*]./httpd1.conf
[*]./temp
3、忽略某个目录
  ------我试过了这种避开目录的方法不管用,还是能看到避开目录下的东西
  如果在查找文件时希望忽略某个目录,因为你知道那个目录中没有你所要查找的文件,那么可以使用- p r u n e选项来指出需要忽略的目录。在使用- p r u n e选项时要当心,因为如果你同时使用了- d e p t h选项,那么- p r u n e选项就会被f i n d命令忽略。
  如果希望在/ a p p s目录下查找文件,但不希望在/ a p p s / b i n目录下查找,可以用:

[*]$ find /apps -path &quot;/apps/bin&quot; -prune -o -print
  -perm选项中,我的解析
  还有一种表达方法:在八进制数字前面要加一个横杠-,表示都匹配,如-007就相当于777,-006相当于666
  使用find查找文件的时候怎么避开某个文件目录
  比如要在/usr/sam目录下查找不在dir1子目录之内的所有文件

[*]find /usr/sam -path &quot;/usr/sam/dir1&quot; -prune -o -print
  QUOTE:
  find 在路径列表的后面的是表达式
  -path &quot;/usr/sam&quot; -prune -o -print 是 -path &quot;/usr/sam&quot; -a -prune -o -print 的简写表达式按顺序求值, -a 和 -o 都是短路求值,与 shell 的 && 和 || 类似如果 -path &quot;/usr/sam&quot; 为真,则求值 -prune , -prune 返回真,与逻辑表达式为真;否则不求值 -prune ,与逻辑表达式为假。 如果 -path &quot;/usr/sam&quot; -a -prune 为假,则求值 -print ,-print 返回真,或逻辑表达式为真;否则不求值-print,或逻辑表达式为真。
  这个表达式组合特例可以用伪码写为

[*]if -path &quot;/usr/sam&quot;then
[*]          -prune
[*]else
[*]          -print
避开多个文件夹,正确写法:
  find /usr/sam \( -path /usr/sam/dir1 -o -path /usr/sam/file1 \) -prune -o -print
  (Deven:错误写法:多了一个 /)
  find /usr/sam \( -path /usr/sam/dir1/ -o -path /usr/sam/file1/ \) -prune -o -print
圆括号表示表达式的结合。
  \ 表示引用,即指示 shell 不对后面的字符作特殊解释,而留给 find 命令去解释其意义。
  查找某一确定文件,-name等选项加在-o 之后
  #find /usr/sam\(-path /usr/sam/dir1 -o -path /usr/sam/file1 \) -prune -o -name &quot;temp&quot; –print
4、使用user和nouser选项
  按文件属主查找文件,如在$ H O M E目录中查找文件属主为sam的文件,可以用:

[*]$ find ~ -user sam -print
  在/ e t c目录下查找文件属主为u u c p的文件:

[*]$ find /etc -user uucp -print
  为了查找属主帐户已经被删除的文件,可以使用- n o u s e r选项。这样就能够找到那些属主在/ e t c / p a s s w d文件中没有有效帐户的文件。在使用- n o u s e r选项时,不必给出用户名; f i n d命令能够为你完成相应的工作。
  例如,希望在/ h o m e目录下查找所有的这类文件,可以用:

[*]$ find /home -nouser -print
  5、使用group和nogroup选项
  就像u s e r和n o u s e r选项一样,针对文件所属于的用户组, f i n d命令也具有同样的选项,为了在/ a p p s目录下查找属于gem用户组的文件,可以用:

[*]$ find /apps -group gem -print
  要查找没有有效所属用户组的所有文件,可以使用n o g r o u p选项。下面的f i n d命令从文件系统的根目录处查找这样的文件

[*]$ find / -nogroup-print
  6、按照更改时间或访问时间等查找文件
  如果希望按照更改时间来查找文件,可以使用mtime, atime或ctime选项。如果系统突然没有可用空间了,很有可能某一个文件的长度在此期间增长迅速,这时就可以用m t i m e选项来查找这样的文件。
  用减号-来限定更改时间在距今n日以内的文件,而用加号+来限定更改时间在距今n日以前的文件。
  希望在系统根目录下查找更改时间在5日以内的文件,可以用:

[*]$ find / -mtime -5 -print
  为了在/ v a r / a d m目录下查找更改时间在3日以前的文件,可以用:

[*]$ find /var/adm -mtime +3 -print
  find 中的 -ctime 和 -mtime ,-atime 区别?
  文件的 Access time,atime 是在读取文件或者执行文件时更改的。
  文件的 Modified time,mtime 是在写入文件时随文件内容的更改而更改的。
  文件的 Create time,ctime 是在写入文件、更改所有者、权限或链接设置时随 Inode 的内容更改而更改的。
  转自:http://www.cppblog.com/beautykingdom/archive/2010/03/17/109880.html

页: [1]
查看完整版本: shell基础二:查找技巧,find及xargs的使用