8516830 发表于 2018-8-19 10:50:34

【一天一个shell命令】文本操作系列-comm

  题外话:说到比较文件,过来人都用过Beyond Compare,老版本时候,我们只能右键选中用于比较的文件,再选中被比较文件,对比。 如今他有了丰富的界面,支持linux上比较文件。 干什么用的?svn管理不善的时候,版本控制做的不好的时候,你就会期望他了。这都是经验- -!
  回到正题:在shell中,也有个这么个命令---comm。 comm可用于两个文件之间的比较。可以用于文件的比较,交集,求差以及差集操作。
  这个定义其实不够详细,应该是 comm逐行比较已排序的文件1和文件2.
  全称:
  (惭愧)没有找到合适的全称。 com 很明显是compare开头,m为mode。望高手指正。
  查看—help
  用法:comm [选项]... 文件1 文件2
  
逐行比较已排序的文件文件1 和文件2。
  如果不附带选项,程序会生成三列输出。第一列包含文件1 特有的行,第二列包含 文件2 特有的行,而第三列包含两个文件共有的行。
  -1      不输出文件1 特有的行
  
-2      不输出文件2 特有的行
  
-3      不输出两个文件共有的行
  --check-order            检查输入是否被正确排序,即使所有输入行均成对
  
--nocheck-order      不检查输入是否被正确排序
  
--output-delimiter=STR    依照STR 分列
  解读:
  1. --check-order
  该命令默认情况下如果希望不检验排序,可以--nocheck-order。
  2. --output-delimiter=STR
  STR 就是个表达式。 可以是任何非特殊字符
  3. -1,-2
  可以写成 -12 与普通命令用起来一样
  实例:
  1.建立A.txt
  加入元素
  apple
  
orange
  
gold
  
silver
  
steel
  
iron
  2. 建立B.txt
  加入元素
  orange
  
gold
  
cookies
  
carrot
  可以尝试直接比较: comm A.txt B.txt
  你会发现提示一个错误,没有排序。
  3. 排序
  


[*]sort A.txt -o A.txt; sort B.txt -o B.txt
  

  4. 比较
  


[*]$comm A.txt B.txt
  


[*]apple
[*]      carrot
[*]      cookies
[*]                gold
[*]iron
[*]                orange
[*]silver
[*]steel
[*]
  

  
结果实际为3列 其中第一列是文件1特有 -1表示删除第一列
  第二列是文件2特有的-2代表删除第二列
  第三列代表共同有的-3代表删除共有的列
  4.1 打印交集:
  $comm –12 A.txt B.txt
  4.2 打印两个文件中不同的行
  $comm –3 A.txt B.txt
  补充个小修改,两列不好看,用sed删除行首的\t
  $comm –3 A.txt B.txt | sed 's/^\t//'
  实战:
  comm在实战中,只会在一些非常特殊的场景中用到。 比较简单,就不举例了。(笔者遇到的场景中,仍然坚持有更好的方案时候,不用这个命令,呵呵)。


页: [1]
查看完整版本: 【一天一个shell命令】文本操作系列-comm