Las 5 mejores herramientas para buscar y eliminar archivos duplicados en Linux

La gestión de archivos es una tarea complicada en sí misma. Agregue a ese gran volumen de archivos duplicados que generalmente acaparan el espacio de almacenamiento, y el proceso se vuelve cada vez más difícil.

Si bien la forma estándar de tratar los archivos duplicados es localizarlos y eliminarlos manualmente. Sin embargo, el uso de un programa de búsqueda de archivos duplicados dedicado en su lugar puede acelerar significativamente el proceso.

Entonces, si planea deshacerse de los archivos duplicados y limpiar su computadora, aquí hay una lista de algunas de las mejores herramientas para encontrar y eliminar archivos duplicados en Linux.

1. Fslint

Fslint es una utilidad basada en GUI y CLI para limpiar varios tipos de desorden de su sistema. Llama a este desorden "pelusa" y ofrece múltiples herramientas para ayudarlo a realizar una multitud de tareas, incluida la búsqueda de archivos duplicados, directorios vacíos y nombres de archivos problemáticos.

Al presentar modos de operación gráficos y de línea de comandos, fslint facilita a los nuevos usuarios de Linux liberar el almacenamiento de su computadora de todo tipo de pelusas del sistema.

Para acceder a fslint a través de la GUI, todo lo que necesita hacer es abrir la terminal y ejecutar el comando fslint-gui .

En lo que respecta a la funcionalidad avanzada, el programa ofrece 10 funcionalidades diferentes en el modo CLI, como findup, findu8, findnl, findtf y finded. Con estos, puede refinar los resultados de la búsqueda para aumentar sus posibilidades de encontrar tipos específicos de archivos duplicados en su sistema.

Cómo instalar fslint

En distribuciones basadas en Debian como Ubuntu:

 sudo apt install fslint

En distribuciones basadas en RHEL como CentOS y Fedora:

 sudo yum install fslint
sudo dnf install fslint

En Arch Linux y Manjaro:

 sudo pacman -S fslint

2. Fdupes

Fdupes es uno de los programas más fáciles de identificar y eliminar archivos duplicados que residen en directorios. Publicado bajo la licencia MIT en GitHub, es gratuito y de código abierto.

El programa funciona mediante el uso de la firma md5sum y la verificación de comparación byte a byte para determinar archivos duplicados en un directorio. Si es necesario, también puede realizar búsquedas recursivas, filtrar los resultados de la búsqueda y obtener una vista resumida de los archivos duplicados descubiertos.

Una vez que haya identificado los archivos duplicados en un directorio, puede usar fdupes para eliminar los archivos o reemplazarlos con enlaces al archivo original.

Instalación de Fdupes

En distribuciones basadas en Debian:

 sudo apt install fdupes

En distribuciones basadas en RHEL:

 sudo yum install fdupes
sudo dnf install fdupes

Para instalar en Arch Linux y Manjaro:

 sudo pacman -S fdupes

Relacionado Cómo buscar y eliminar archivos duplicados en Linux usando fdupes

3. Rdfind

Rdfind es otra utilidad de Linux para ayudarlo a encontrar archivos redundantes en su computadora en diferentes directorios. Se basa en comparar archivos en función de su contenido, y no de su nombre, para identificar duplicados, lo que lo hace más eficaz en su trabajo.

Para lograr esto, el programa trabaja clasificando archivos iguales en un directorio y determinando el original y los duplicados: el de mayor rango se selecciona como original mientras que el resto son duplicados.

Además, rdfind también puede calcular sumas de comprobación para comparar archivos cuando sea necesario. Y la mejor parte es que guarda los resultados escaneados en un archivo results.txt en el directorio de inicio, por lo que puede consultarlo cuando esté a punto de eliminar duplicados para asegurarse de no eliminar los incorrectos.

Por supuesto, como con la mayoría de los otros buscadores de archivos duplicados, rdfind también ofrece algunos preprocesadores para ordenar archivos, ignorar archivos vacíos o establecer enlaces simbólicos. Por último, pero no menos importante, también hay una opción para eliminar archivos duplicados.

Relacionado: ¿Qué es un enlace simbólico (enlace simbólico)? Cómo crear uno en Linux

Cómo instalar rdfind

En Debian / Ubuntu:

 sudo apt install rdfind

En Fedora / CentOS:

 sudo dnf install rdfind

4. DupeGuru

DupeGuru es una herramienta multiplataforma para encontrar y eliminar archivos duplicados en su máquina. Una de sus mejores características es la opción de personalizar el motor de búsqueda de coincidencias para que se adapte a sus preferencias a fin de aumentar sus posibilidades de encontrar el tipo correcto de archivos duplicados en un directorio. Y al igual que algunos otros programas de búsqueda de duplicados, también ofrece una GUI para facilitar las operaciones.

Hablando de funcionalidad, dupeGuru aprovecha su algoritmo de coincidencia difusa para escanear nombres de archivos o contenido de archivos y encontrar duplicados de manera rápida y eficiente.

Además, también es bueno para manejar información específica de música e imágenes, lo que le da una ventaja sobre otros buscadores de archivos duplicados. Además, si es necesario, tiene la opción de modificar su motor de coincidencia para localizar exactamente el tipo de archivos duplicados que desea eliminar.

DupeGuru también te permite eliminar archivos duplicados. Y para ello, cuenta con un sistema de directorio de referencia, que evita que borres accidentalmente los archivos incorrectos. Además de la eliminación, también existe la opción de moverlos o copiarlos a otro lugar.

Instalación de DupeGuru

En distribuciones basadas en Debian:

 sudo add-apt-repository ppa:dupeguru/ppa
sudo apt-get update
sudo apt-get install dupeguru

En Arch Linux:

 sudo pacman -S dupeguru

5. Rmlint

Rmlint es otro buscador y eliminador de pelusa, y no solo archivos duplicados, para Linux. Es de uso gratuito y extremadamente rápido para identificar archivos y directorios duplicados en su sistema. También obtiene soporte para el formato de almacenamiento Btrfs, lo que lo hace destacar de otras herramientas en esta lista.

Hablando de eso, algunos de los otros aspectos en los que rmlint supera a las otras herramientas de eliminación de archivos duplicados de la competencia incluyen la capacidad de buscar archivos en función de un período de tiempo en particular, encontrar archivos con ID de usuario / grupo rotos y encontrar binarios no eliminados que ocupan mucho del espacio. Además, al igual que algunos otros programas, también guarda los resultados escaneados en archivos rmlint.json y rmlint.sh , que son útiles durante la operación de eliminación.

Sin embargo, tenga en cuenta que, a diferencia de otras herramientas, rmlint no es la más fácil de usar: genera una secuencia de comandos para eliminar duplicados, que requiere cierto nivel de comprensión para usarse de manera efectiva.

Cómo instalar rmlint

En distribuciones basadas en Debian:

 sudo apt install rmlint

En Fedora y CentOS:

 sudo yum install rmlint
sudo dnf install rmlint

En distribuciones basadas en Arch como Manjaro:

 sudo pacman -S rmlint

Mantener los archivos duplicados a raya en Linux

Con los programas de búsqueda de archivos duplicados enumerados anteriormente, puede identificar fácilmente los archivos duplicados que podrían estar ocupando espacio en su máquina y eliminarlos por completo. Sin embargo, un consejo cuando se trabaja con tales herramientas es que tenga mucho cuidado con sus acciones para evitar terminar eliminando archivos y documentos importantes en su sistema.

En caso de que sea un poco escéptico sobre qué archivos eliminar y cuáles conservar, asegúrese de hacer una copia de seguridad de todos los datos de su sistema para estar más seguro.