华风 发表于 2018-8-22 06:37:02

【一天一个shell命令】文本内容操作系列-grep

  从这篇开始,是文本内容操作,区别于文本操作。
  shell,perl,python,一直都是文本操作的专家语言,而我们今后学习的的将是shell的噱头--文本操作。下面提到最常见的一个:
  grep
  这算是文本内容的一个重量级选手,能根据某些规格在上千行的文本文件中查找所需要的数据。他能接受正则表达式和通配符。
  基础实例:
  1. 命令翻译包含给定match_pattern的文本行,如我在grep.txt中查找PATTERN
  grep PATTERN grep.txt
  or grep "PATTERN" grep.txt
  2. 匹配多个文件
  grep PATTERN grep.txt grep1.txt
  3. 从stdin中读取
  echo –e "this is a word\nnext line" | grep word
  打印:this is a word
  4. grep 与 正则表达式
  grep –E "+"
  或者
  egrep "+"
  5. 只输出匹配部分,而不是匹配的当前行
  echo this is line. | greip –o –E "+\."
  输出:line
  6. 打印除包含match_pattern的行之外的所有行,可使用
  grep -v match_pattern file
  7. 统计文本或者文件中包含匹配字符串的字数(这个面试经常会问到)
  $grep -c "text" filename
  但他给出的是匹配行的次数,而不是匹配的次数
  统计匹配数量的话,可以用到下面的技巧
  $echo –e "1 2 3 4\nhello\n5 6"| egrep -o "" | wc –l
  打印1到6 | 从stdin中读取数字,分行打印 | 统计行数
  8. 打印行号
  grep "text" -n filename
  9. 搜2个文件,以及他们的行号,输出会打印文件名
  grep "text"–n s1.txt s2.txt
  10.如果你只想知道哪些文件有 单词PATTERN
  grep –l PATTER s1.txt s2.txt
  -L则返回的不匹配文件列表
  11.可以再整个目录下查找 单词PATTERN 在那些文件里
  grep PATTERN . -R -n
  12 同时多个匹配查找
  echo this is a line of text | grep -e "this" -e "line" -o
  打印:
  this
  line
  13 只在某些合适的文件中搜索
  grep "main()" .-r --include *.{c,cpp}
  只在.c 和.cpp结尾的文件中搜索 main()
  14 进行搜索排除某些文件
  grep "main()" . -r --exclude "README"
  排除了所有文件名为"README"的文件
  15 打印匹配之前或之后的3行
  seq 10 | grep 5 –A 3 之前
  seq 10 | grep 6 –B 3 之后
  16 打印匹配前后3行,同时输出
  seq 10 | grep 5 –C 3
  我们来看下--help
  用法: grep [选项]... PATTERN ...
  在每个 FILE 或是标准输入中查找 PATTERN。
  默认的 PATTERN 是一个基本正则表达式(缩写为 BRE)。
  例如: grep -i 'hello world' menu.h main.c
  正则表达式选择与解释:
  -E, --extended-regexp   PATTERN 是一个可扩展的正则表达式(缩写为 ERE)
  -F, --fixed-strings       PATTERN 是一组由断行符分隔的定长字符串。
  -G, --basic-regexp      PATTERN 是一个基本正则表达式(缩写为 BRE)
  -P, --perl-regexp         PATTERN 是一个 Perl 正则表达式
  -e, --regexp=PATTERN      用 PATTERN 来进行匹配操作
  -f, --file=FILE         从 FILE 中取得 PATTERN
  -i, --ignore-case         忽略大小写
  -w, --word-regexp         强制 PATTERN 仅完全匹配字词
  -x, --line-regexp         强制 PATTERN 仅完全匹配一行
  -z, --null-data         一个 0 字节的数据行,但不是空行
  内容比较多,所以不全贴出来,全部内容在附件中。
  大多数功能已经在实例中贴出,我的这个博文中,主要参考书籍《linux shell脚本攻略》
  如果你觉得更是个学习时间比较充裕,不妨直接购买此书。

页: [1]
查看完整版本: 【一天一个shell命令】文本内容操作系列-grep