linux diff 比较命令二

xiaoxiao2023-03-24 2

sdiff 和diff(文本比较)

功能说明：diff 命令比较文本文件。它能比较单个文件或者目录内容。

备注：diff 命令只有当输入为文本文件时才有效。

如果两个二进制文件相同，diff就什么也不显示，否则只简单报告一下这两个文件是不相同的。

[root@auc-test2 home]# diff ./eccs.bin /usr/bin/zip Binary files ./eccs.bin and /usr/bin/zip differ [root@auc-test2 home]# diff eccs.bin eccs.bin

语　　法：diff [-abBcdefHilnNpPqrstTuvwy][-<行数>][-C <行数>][-D <巨集名称>][-I <字符或字符串>][-S <文件>][-W <宽度>][-x <文件或目录>][-X <文件>][--help][--left-column][--suppress-common-line][文件或目录1][文件或目录2]

补充说明：diff以逐行的方式，比较文本文件的异同处。所是指定要比较目录，则diff会比较目录中相同文件名的文件，但不会比较其中子目录。

参　　数：

　-<行数> 　指定要显示多少行的文本。此参数必须与-c或-u参数一并使用。

　-a或--text 　diff预设只会逐行比较文本文件。

　-b或--ignore-space-change 　不检查空格字符的不同。

　-B或--ignore-blank-lines 　不检查空白行。

　-c 　显示全部内文，并标出不同之处。

　-C<行数>或--context<行数> 　与执行"-c-<行数>"指令相同。

　-d或--minimal 　使用不同的演算法，以较小的单位来做比较。

　-D<巨集名称>或ifdef<巨集名称> 　此参数的输出格式可用于前置处理器巨集。

　-e或--ed 　此参数的输出格式可用于ed的script文件。

　-f或-forward-ed 　输出的格式类似ed的script文件，但按照原来文件的顺序来显示不同处。

　-H或--speed-large-files 　比较大文件时，可加快速度。

　-l<字符或字符串>或--ignore-matching-lines<字符或字符串> 　若两个文件在某几行有所不同，而这几行同时都包含了选项中指定的字符或字符串，则不显示这两个文件的差异。

　-i或--ignore-case 　不检查大小写的不同。

　-l或--paginate 　将结果交由pr程序来分页。

　-n或--rcs 　将比较结果以RCS的格式来显示。

　-N或--new-file 　在比较目录时，若文件A仅出现在某个目录中，预设会显示：

Only in目录：文件A若使用-N参数，则diff会将文件A与一个空白的文件比较。

　-p 　若比较的文件为C语言的程序码文件时，显示差异所在的函数名称。

　-P或--unidirectional-new-file 　与-N类似，但只有当第二个目录包含了一个第一个目录所没有的文件时，才会将这个文件与空白的文件做比较。

　-q或--brief 　仅显示有无差异，不显示详细的信息。

　-r或--recursive 　比较子目录中的文件。

　-s或--report-identical-files 　若没有发现任何差异，仍然显示信息。

　-S<文件>或--starting-file<文件> 　在比较目录时，从指定的文件开始比较。

　-t或--expand-tabs 　在输出时，将tab字符展开。

　-T或--initial-tab 　在每行前面加上tab字符以便对齐。

　-u,-U<列数>或--unified=<列数> 　以合并的方式来显示文件内容的不同。

　-v或--version 　显示版本信息。

　-w或--ignore-all-space 　忽略全部的空格字符。

　-W<宽度>或--width<宽度> 　在使用-y参数时，指定栏宽。

　-x<文件名或目录>或--exclude<文件名或目录> 　不比较选项中所指定的文件或目录。

　-X<文件>或--exclude-from<文件> 　您可以将文件或目录类型存成文本文件，然后在=<文件>中指定此文本文件。

　-y或--side-by-side 　以并列的方式显示文件的异同之处。

　--help 　显示帮助。

　--left-column 　在使用-y参数时，若两个文件某一行内容相同，则仅在左侧的栏位显示该行内容。

　--suppress-common-lines 　在使用-y参数时，仅显示不同之处。

由于历史原因，diff有三种格式：

正常格式（normal diff）

上下文格式（context diff）

合并格式（unified diff）

a)正常格式（normal diff）

例子1

[root@auc-test2 11]# cat a.bak a b [root@auc-test2 11]# cat b.bak a c [root@auc-test2 11]# diff a.bak b.bak 2c2 < b --- > c

说明：

它分成三个部分：前面的"2"，表示a.bak的第2行有变化；中间的"c"表示变动的模式是内容改变（change），其他模式还有"增加"（a，代表addition）和"删除"（d，代表deletion）；后面的"2"，表示变动后变成b.bak的第4行。

第二行分成两个部分

< a

前面的小于号，表示要从a.bak当中去除该行（也就是第4行），后面的"a"表示该行的内容。

第三行用来分割a.bak和b.bak

---

第四行，类似于第二行

> b

b)上下文格式的diff

上个世纪80年代初，加州大学伯克利分校推出BSD版本的Unix时，觉得diff的显示结果太简单，最好加入上下文，便于了解发生的变动。因此，推出了上下文格式的diff。

[root@auc-test2 11]# diff -c a.bak b.bak *** a.bak 2014-12-17 13:16:23.249068034 +0800 --- b.bak 2014-12-17 13:16:31.339067978 +0800 *************** *** 1,2 **** a ! b --- 1,2 ---- a ! c

第一部分的两行，显示两个文件的基本情况：文件名和时间信息。

*** a.bak 2014-12-17 13:16:23.249068034 +0800

--- b.bak 2014-12-17 13:16:31.339067978 +0800

"***"表示变动前的文件，"---"表示变动后的文件。

第二部分是15个星号，将文件的基本情况与变动内容分割开。

***************

第三部分显示变动前的文件，即a.bak

*** 1,2 ****

! b

这时不仅显示发生变化的第2行，还显示第2行的前面一行，因此一共显示2行。所以，前面的"*** 1,2 ****"就表示，从第1行开始连续2行。

另外，文件内容的每一行最前面，还有一个标记位。如果为空，表示该行无变化；如果是感叹号（!），表示该行有改动；如果是减号（-），表示该行被删除；如果是加号（+），表示该行为新增。

第四部分显示变动后的文件，即b.bak

--- 1,2 ----

! c

除了变动行（第2行）以外，也是上文各显示一行，总共显示2行。

c)合并格式的diff

如果两个文件相似度很高，那么上下文格式的diff，将显示大量重复的内容，很浪费空间。1990年，GNU diff率先推出了"合并格式"的diff，将linuxeye1和linuxeye2的上下文合并在一起显示。

它的使用方法是加入u参数（代表unified）。

[root@auc-test2 11]# diff -u a.bak b.bak --- a.bak 2014-12-17 13:16:23.249068034 +0800 +++ b.bak 2014-12-17 13:16:31.339067978 +0800 @@ -1,2 +1,2 @@ a -b +c

它的第一部分，也是文件的基本信息

--- a.bak 2014-12-17 13:16:23.249068034 +0800

+++ b.bak 2014-12-17 13:16:31.339067978 +0800

"---"表示变动前的文件，"+++"表示变动后的文件

第二部分，变动的位置用两个@作为起首和结束

@@ -1,2 +1,2 @@

前面的"-1,2"分成三个部分：减号表示第一个文件（即a.bak），"1"表示第1行，"2"表示连续2行。合在一起，就表示下面是第一个文件从第1行开始的连续2行。同样的，"+1,2"表示变动后，成为第二个文件从第1行开始的连续2行。

第三部分是变动的具体内容

-b

除了有变动的那些行以外，也是上下文各显示1行。它将两个文件的上下文，合并显示在一起，所以叫做"合并格式"。每一行最前面的标志位，空表示无变动，减号表示第一个文件删除的行，加号表示第二个文件新增的行

版本管理系统git，使用的是合并格式diff的变体.

让我们通过一些实际的例子理解diff命令。

一、文件比较

假设我们有两个文件(file1 和 file2)：

$ cat file1 Hi, Hello, How are you? I am fine, Thank you.

$ cat file2 Hello, Hi, How are you? I am fine.

你可以看见两个文件有些小的不同。现在，让我们看看diff命令如何找出两者的不同的。

像这样运行diff命令：

$ diff file1 file2 1d0 < Hi, 2a2 > Hi, 4,5c4 < I am fine, < Thank you. --- > I am fine.

你可以看见diff后面跟了两个文件的名字作为命令行的参数，并且它在输出中生成了差异比较。输出并不容易理解。理由是，这是被计算机使用的而不是为了人类。尽管如此，让我们一步步解码输出：

注意 – 在下面的文本中，file1和file2将被当作旧文件和新文件。

1d0 < Hi,

这里，1d0这一行意味着旧文件的第一行应该被删除(d)以使两个文件的第一行同步。旧文件中需要被删除的行以'<'标记。

2a2 > Hi,

这里，2a2行意味着新文件中的第二行应该加到旧文件的第二行后。要添加的行显示在输出的下一行用'>'标记。

4,5c4 < I am fine, < Thank you. --- > I am fine.

这里，4,5c4这一行意味着在旧文件中的4到5行现在已被改变并且需要用新文件中的第4行代替。

添加和删除的行分别用'>'和'<'表示。

来总结一下：

首先diff命令的第一个参数被视为旧文件而第二个参数被视为新文件。

像1d0、2a2、4,5c4这种表达式可以用语法解码为 [旧文件的行号或者行的范围][行为][新文件的行号或者行的范围]。这里的'行为'可以是追加,删除或者改变替换。

'<'代表删除的行，而'>'代表添加的行。

二、比较两个目录。

这里是'new_dir'目录包含的内容：

[root@auc-test2 huang]# cp -rf 11 22 [root@auc-test2 huang]# ls 11 22 ifup.sh ps.txt tmp [root@auc-test2 huang]# diff 11 22 [root@auc-test2 huang]# cd 11/ [root@auc-test2 11]# ls a.bak a.bak.bak b.bak c.bak cmp.sh [root@auc-test2 11]# rm -rf cmp.sh [root@auc-test2 11]# ls a.bak a.bak.bak b.bak c.bak [root@auc-test2 11]# cd .. [root@auc-test2 huang]# diff 11 22 Only in 22: cmp.sh

你可以看到当diff命令被用来比较这两个目录时，很容易就会显示两个文件中缺失的文件。

下面是一些在命令行下常用的选项：

1. 用 -i 忽略大小写

如果两个文件含有相同的文本但是大小写不同，diff命令仍会默认报告它不同。

比如：

$ cat file1 HI $ cat file2 hi $ diff file1 file2 1c1 < HI --- > hi

你可以看见diff命令在输出中报告了大小写不同。

要去除这个默认行为，使用-i选项。

以下是个例子：

$ diff -i file1 file2 $

这样你可以看到没有生成输出，这是当两个文件相同时的默认行为。

2. 用 -s 选项报告两个文件相同

在例子1的后面，我们看到如果文件相同diff不会生成报告。虽然这个默认行为不错但是它仍可能会造成很大疑惑，特别对于新手而言。因此，如果你像样diff命令明确地报告两个文件不同，那么就使用-s命令选项。

来举个例子：

$ diff -is file1 file2 Files file1 and file2 are identical

你可以看到我加了-s选项在后面的例子中，这次diff命令会明确地报告两个文件是相同的。

3. 使用 -b 忽略空格

另外一个常用的是diff报告文件存在不同数量的空格。

举例说明：

$ cat file1 Hi, how are you? $ cat file2 Hi, how are you?

观察这两个文件唯一的不同是file2中'are'和'you'之间额外的空格。现在，当使用diff命令比较两个文件时，输出如下：

$ diff file1 file2 1c1 < Hi, how are you? --- > Hi, how are you?

因此你可以看到diff命令报告了不同。但是如果你想要忽略这些空格，使用 -b 选项。

$ diff -b file1 file2 $

这样你可以看到由于-b选项，diff命令报告这两个文件是相同的。

转载请注明原文地址: https://ju.6miu.com/read-1200175.html

最新回复(0)