分析家 发表于 2018-6-15 10:20:14

DOS/Windows和Linux/Unix的文件格式转换

DOS/Windows和Linux/Unix的文件换行回车格式不同,基于 DOS/Windows 的文本文件在每一行末尾有一个 CR(回车)和 LF(换行),而 UNIX 文本只有一个换行。  1)、把Dos/Windows下的文件移至Linux/Unix系统
  虽然很多程序不在乎 DOS/Windows 格式的 CR/LF 文本文件,但是有几个程序却在乎 -- 最著名的是 bash,只要一遇到回车,它就会出问题。以下 sed 调用将把 DOS/Windows 格式的文本转换成可信赖的 UNIX 格式:
  $ sed -e 's/.$//' mydos.txt > myunix.txt
  该脚本的工作原理很简单:替代规则表达式与一行的最末字符匹配,而该字符恰好就是回车。我们用空字符替换它,从而将其从输出中彻底删除。如果使用该脚本并注意到已经删除了输出中每行的最末字符,那么,您就指定了已经是 UNIX 格式的文本文件。也就没必要那样做了!
  2)、把Linux/UNIX 文本移至 Windows 系统,使用以下脚本执行必需的格式转换:
  $ sed -e 's/$/\r/' myunix.txt > mydos.txt
  在该脚本中,'$' 规则表达式将与行的末尾匹配,而 '\r' 告诉 sed 在其之前插入一个回车。在换行之前插入回车,立即,每一行就以 CR/LF 结束。请注意,仅当使用 GNU sed 3.02.80 或以后的版本时,才会用 CR 替换 '\r'。
  3)使用dos2unix和unix2dos命令,这种方法最简单。
  在window上随便创建一个文件Noname2.txt,内容如下:
  sfadadfad
  sfasd
  fads
  fasdfads
  在Linux上用hexdump工具进行查看:
  A52>hexdump Noname2.txt
  0000000 6673 6461 6461 6166 0d64 730a 6166 6473
  0000010 0a0d 6166 7364 0a0d 6166 6473 6166 7364
  0000020 0a0d
  0000022
  用dos2unix工具转换后:
  A52>dos2unix Noname2.txt
  dos2unix: converting file Noname2.txt to UNIX format ...
  A52>hexdump Noname2.txt
  0000000 6673 6461 6461 6166 0a64 6673 7361 0a64
  0000010 6166 7364 660a 7361 6664 6461 0a73
  000001e
  再使用unix2dos转换回去:
  A52>unix2dos Noname2.txt
  unix2dos: converting file Noname2.txt to DOS format ...
  A52>hexdump Noname2.txt
  0000000 6673 6461 6461 6166 0d64 730a 6166 6473
  0000010 0a0d 6166 7364 0a0d 6166 6473 6166 7364
  0000020 0a0d
  0000022
页: [1]
查看完整版本: DOS/Windows和Linux/Unix的文件格式转换