Introducción
diff
es una utilidad de línea de comandos que le permite comparar dos archivos línea por línea. También puede comparar el contenido del directorio.
El diff
se usa más comúnmente para crear un parche que contiene las diferencias entre uno o más archivos que se pueden aplicar usando el comando patch
Cómo usar el comando diff
La sintaxis del diff
es la siguiente:
diff [OPTION]... FILES
El diff
puede mostrar la salida en varios formatos; normales, contextuales y unificados, que son los más habituales. La salida incluye información sobre qué líneas de los archivos deben cambiarse para que sean idénticas. Si los archivos coinciden, no se produce ninguna salida.
Para guardar la salida del comando en un archivo, use el operador de redireccionamiento:
diff file1 file2 > patch
En este artículo, usaremos los siguientes dos archivos para explicar cómo funciona el comando diff
Archivo 1:
Ubuntu
Arch Linux
Debian
CentOS
Fedora
Archivo 2:
Kubuntu
Ubuntu
Debian
Arch Linux
Centos
Fedora
Talla normal
En su forma más simple, cuando el diff
se ejecuta en dos archivos de texto sin opciones, produce una salida en el formato normal:
diff file1 file2
La salida se verá así:
0a1
> Kubuntu
2d2
< Arch Linux
4c4,5
< CentOS
---
> Arch Linux
> Centos
El formato de salida normal consta de una o más secciones que describen las diferencias. Cada sección se ve así:
change-command
< from-file-line...
---
> to-file-line...
0a1
, 2d2
y 4c4,5
son comandos de cambio. Cada comando de edición contiene lo siguiente, de izquierda a derecha:
- El número de línea o rango de líneas en el primer archivo.
- Un carácter especial de cambio.
- El número de línea o rango de líneas en el segundo archivo.
El carácter de cambio puede ser uno de los siguientes:
a
- Agregar líneas.c
- Cambiar las líneas.d
- Eliminar las líneas.
El comando de cambio va seguido de las líneas completas eliminadas con el <
) y agregadas al archivo con el >
).
Explicamos la salida:
0a1
: agregue la línea1
del segundo archivo al comienzo del archivo1 (después de la línea0
).> Kubuntu
: la línea de la segunda línea que se agrega al primer archivo como se describe arriba.2d2
: elimina la línea2
del primer archivo. El símbolo2
después ded
indica que si la línea no se elimina, se mostrará en la línea2
del segundo archivo.< Arch Linux
: la línea eliminada.4c4,5
- Reemplace (cambie) la línea5
en el primer archivo con las líneas4-5
en el segundo archivo.< CentOS
: la línea del primer archivo que se reemplazará.---
- Separador.> Arch Linux
y> Centos
: líneas del segundo archivo que reemplazan la línea del primer archivo.
Formato de contexto
Cuando se usa el formato de salida de contexto, el diff
muestra varias líneas de contexto alrededor de las líneas que difieren entre archivos.
La -c
dice permite que la diff
produzca resultados en el formato de contexto:
diff -c file1 file2
*** file1 2019-11-25 21:00:26.422426523 +0100
--- file2 2019-11-25 21:00:36.342231668 +0100
***************
*** 1,6 ****
Ubuntu
- Arch Linux
Debian! CentOS
Fedora
--- 1,7 ----
+ Kubuntu
Ubuntu
Debian! Arch Linux! Centos
Fedora
La salida comienza con los nombres y las marcas de tiempo de los archivos que se comparan y una o más secciones que describen las diferencias. Cada sección tiene este aspecto:
***************
*** from-file-line-numbers ****
from-file-line...
--- to-file-line-numbers ----
to-file-line...
from-file-line-numbers
yto-file-line-numbers
: los números de línea o el rango de líneas separadas por comas en el primer y segundo archivo, respectivamente.from-file-line
yto-file-line
- Las diferentes líneas y líneas de contexto:- Las líneas que comienzan con dos espacios son líneas de contexto, líneas que son iguales en ambos archivos.
- Las líneas que comienzan con el símbolo menos (
-
) son líneas que no coinciden con nada en el segundo archivo. Faltan líneas en el segundo archivo. - Las líneas que comienzan con el símbolo más (
+
) son las líneas que no coinciden con nada en el primer archivo. Faltan líneas en el primer archivo. - Las líneas que comienzan con el signo de exclamación (
!
) Son las líneas cambiadas entre dos archivos. Cada grupo de líneas comienza con!
en el primer archivo tiene una coincidencia en el segundo archivo.
Explicamos las partes más importantes del resultado:
- En este ejemplo, solo tenemos una sección que describe las diferencias.
*** 1,6 ****
y--- 1,7 ----
nos dice el rango de líneas del primer y segundo archivo que se incluyen en esta sección.Ubuntu
,Debian
,Fedora
y las últimas líneas en blanco son iguales en ambos archivos. Estas líneas comienzan con espacios dobles.- La línea
- Arch Linux
del primer archivo no coincide con nada en el segundo archivo. Aunque esta línea también existe en el segundo archivo, las ubicaciones son diferentes. - La
+ Kubuntu
del segundo archivo no coincide con nada en el primer archivo. - ¡La línea
! CentOS
desde el primer archivo y líneas! Arch Linux
y! CentOS
del segundo archivo se cambia entre archivos.
De forma predeterminada, el número de líneas de contexto se establece en tres. Para especificar otro número, use la -C
( --contexts
):
diff -C 1 file1 file2
*** file1 2019-11-25 21:00:26.422426523 +0100
--- file2 2019-11-25 21:00:36.342231668 +0100
***************
*** 1,5 ****
Ubuntu
- Arch Linux
Debian! CentOS
Fedora
--- 1,6 ----
+ Kubuntu
Ubuntu
Debian! Arch Linux! Centos
Fedora
Formato unificado
El formato de salida unificado es una versión mejorada del formato de contexto y produce una salida más pequeña.
Use la -u
para decirle al diff
que imprima la salida en el formato unificado:
diff -u file1 file2
--- file1 2019-11-25 21:00:26.422426523 +0100
+++ file2 2019-11-25 21:00:36.342231668 +0100
@@ -1,6 +1,7 @@
+Kubuntu
Ubuntu
-Arch Linux
Debian
-CentOS
+Arch Linux
+Centos
Fedora
La salida comienza con los nombres de los archivos y las marcas de tiempo y una o más secciones que describen las diferencias. Cada sección tiene la siguiente forma:
***************
@@ from-file-line-numbers to-file-line-numbers @@
line-from-files...
@@ from-file-line-numbers to-file-line-numbers @@
- El número o rango de líneas del primer y segundo archivos incluidos en esta sección.line-from-files
: las líneas que difieren y las líneas de contexto:- Las líneas que comienzan con dos espacios son líneas de contexto, líneas que son iguales en ambos archivos.
- Las líneas que comienzan con el símbolo menos (
-
) son las líneas que se eliminan del primer archivo. - Las líneas que comienzan con el símbolo más (
+
) son las líneas agregadas desde el primer archivo.
Ignorar el caso
Como puede ver en los ejemplos anteriores, el diff
distingue entre mayúsculas y minúsculas de forma predeterminada.
Use la -i
para decirle al diff
que ignore el caso:
diff -ui file1 file2
--- file1 2019-11-25 21:00:26.422426523 +0100
+++ file2 2019-11-25 21:00:36.342231668 +0100
@@ -1,6 +1,7 @@
+Kubuntu
Ubuntu
-Arch Linux
Debian
+Arch Linux
CentOS
Fedora
Conclusión
Comparar archivos de texto en busca de diferencias es una de las tareas más comunes para los administradores de sistemas Linux.
El diff
compara los archivos línea por línea. Para obtener más información, escriba el siguiente comando en la terminal:
man diff