k668 发表于 2018-8-27 10:06:48

Shell笔记——命令:Sort,uniq,join,cut,paste,split

  原文地址:Shell笔记——命令:Sort,uniq,join,cut,paste,split作者:fengpiaoxue
  转自:http://blog.csdn.net/wklken/article/details/6562098
  Sort,uniq,join,cut,paste,split
  命令—— Sort
  Sort 可将许多不同的域按不同的列顺序分类
  命令格式:
  sort –cmu –o out-putfile *pos1 *pos2 input-files
  选项:
  -c 测试文件是否已经分类
  -m 合并两个分类文件
  -u 删除所有复制行
  -o 存储 sort 结果的输出文件名
  -b 使用域进行分类是,忽略首个空格
  -n 指定分类是域上数字分类
  -t 域分隔符;用非空个或者 tab 键分割域
  -r 对分类次序或比较求逆
  +n n 为域号,使用此域开始分类
  n n 为域号,在分类比较时忽略此域,一般与 +n 一起使用
  post m,n 传递到 m,n , m 为域号, n 为开始分类字符数
  示例 :
  1.       保存输出
  $sort –o result sortfile
  $sort sortfile > result
  Sort 的启动方式, sort 认为一空格 / 多空格为分隔符,要加入其他的,必须使用 -t ,执行时,先查看 -t, 若是有,使用其进行分割,若是无,使用空格
  2.       查看文件是否已排序
  $sort –c sortfile
  3.       使用其他分隔符
  $sort –t   : sortfile
  4.       排完序后求逆
  $sort –t : -r sortfile
  5.       唯一分类,原文件中重复行去除
  $sort –u sortfile
  6.       指定分类域, 1 开始
  $sort –t : -k 4 sortfile
  $sort –t : -k 4 –k 1 sortfile
  7.       指定 sort 序列
  $sort +0 -2 +3 sortfile
  8.       将两个分类文件合并
  $sort –m sorted-file1 sorted_file2
  命令—— uniq
  Uniq 从文本文件中去除或禁止重复行,一般 uniq 假定文件已分类排序,并且结果正确
  Uniq 中重复行指持续不断重复出现的行
  格式 :uniq –udc –f input-file output-file
  选项:
  -u 只显示不重复行
  -d 只显示有重复的行,每种重复显示一行
  -c 打印每一重复行出现的次数
  -f n 为数字,前 n 个域被忽略
  1. 只显示非重复行
  $uniq –u sortfile
  2. 提取非重复行到某个文件
  $uniq –u sortfile result
  3. 只显示重复行
  $uniq –d sortfile
  4. 打印重复行及其出现的次数
  $uniq –c sortfile
  5. 忽略比较指定列
  $uniq –f2 parts.txt
  命令—— join
  将来自两个分类文本文件的行连在一起
  前提 : file1,file2 已分类
  每个文件都有一些元素与另一文件相关——连
  有点像求并集
  注: joio 时文本域要少于 20=
  格式: join input-file   input-file2
  选项:
  an       n 为数字,用于连接时从文件 n 中显示不匹配行 ,-a1 表示第一个文件的不匹配行
  o n,m    n 为文件号, m 为域号,   1,3 表示只显示文件 1 的第三域
  j n m   n 为文件号, m 为域   使用其他域做连接域
  t 域分隔符   用来设置非空格 / 非 tab 分隔符
  1.       连接两个文件 [ 默认连接域为域 0]
  $Join name.txt. turn.txt
  2.       显示第一个文件的不匹配行
  $join –a1 name.txt town.txt
  3.       设置显示连接结果
  $join –o 1.1,2.2 name.txt town.txt
  第一个文件第一个域和第二个文件第二个域作为显示结果
  4.       设置连接域
  $join –j 1 3 –j 2 2 file1 file2
  命令—— cut
  用来从标准输入或文本文件中剪切列或域
  可将剪切到的文本贴到另一个文件中
  格式 :cut file1 file2
  选项:
  -c list指定剪切字符数
  -f field 指定剪切域数
  -d 指定与空格 /tab 不同的分隔符
  -c 指定剪切的字符范围,字符,如 -c 1,5,7第 1,5,6,7 字符    -c 1-50 前 50 个字符
  -f指定剪切的域范围   -f 1,5 剪切 1,5 两个域    -f 1,10-12 剪切 1,10,11,12 四个域
  1.       使用域分隔符
  $cut –d : -f3 data
  # cut -d: -f1 /etc/passwd |head -5
  root
  bin
  daemon
  adm
  lp
  –d : 指示cut改用:为分隔符,-f1表示第一个字段意思。
  2.       剪切指定域
  $cut –d : -f1,3 data   ##表示取出各行第一及第三个字段意思
  3.       剪切字符
  $who –u | cut –c 1-8
  # who -u
  root   tty1         2011-10-19 22:09old         2463 (:0)
  root   pts/0      2011-11-04 08:48   .          7804 (192.168.0.86)
  root   pts/2      2011-10-31 09:25old      18934 (:0.0)
  root   pts/3      2011-10-31 09:47old      18934 (:0.0)
  # who -u |cut -c 1-8
  root
  root
  root
  root
  命令: paste
  Paste 将数据贴到相关文件中
  存在两个不同来源 数据应先分类,确保文件行数同
  格式 :paste –d –s file1 file2
  选项:
  -d 指定不同分隔符
  -s 将每个文件合并成行而不是按行黏贴
  File1
  1
  2
  File2
  A
  B
  1.       合并之
  $paste file1 file2
  1         A
  2         B
  2.       指定分隔符
  $paste –d: file2 file1
  A:1
  B:2
  3.       合并两行,而非按行黏贴
  $paste –s file1 file2
  命令: split
  用来将文件切分为小文件
  格式: split –output_file_size input_filename output_filename
  其中 out_file_size 为被分割行数,默认 1000

页: [1]
查看完整版本: Shell笔记——命令:Sort,uniq,join,cut,paste,split