Eliminando archivos duplicados

Una buena medida a la hora de liberar un poco de espacio en disco es la de eliminar todos los archivos duplicados que surgen porque:

  • descargamos varias veces la misma cosa y no nos damos cuenta.
  • guardamos páginas web para leerlas después y nos quedan 350.000 .gif, .css, .js, etc. repetidos.
  • copiamos las cosas de un lado al otro para hacer un backup, vaciar un pen, etc. y después no sabemos que es que y lo dejamos por las dudas.

A nuestra ayuda viene FSLint, que no solo se encarga de hallar duplicados, sino que también de encontrar directorios vacíos, archivos temporales, nombres inválidos, ids inválidos, espacios en blanco, etc.

Para realizar la instalación ingresamos:

$ sudo apt-get install fslint

Una vez instalado podemos iniciar su interfaz gráfica con la orden fslint-gui.

FSlint

FSlint buscando archivos duplicados

Desde la interfaz tenemos que agregar un directorio que tomaremos como base para realizar la búsqueda de duplicados. Marcamos o desmarcamos “¿Recurso?” para hacer recursiva la búsqueda (la traducción no es muy afortunada).

Con la primera pestaña le ordenaremos a Fslint hacer una búsqueda de archivos duplicados y luego de presionar el botón “buscar” nos mostrará un listado ordenado por grupos de archivos repetidos.

Seleccionamos los archivos sobre los que vamos a trabajar presionando “Seleccionar” y eligiendo el criterio (seleccionamos todos menos el primero de cada grupo, seleccionamos los más nuevos o seleccionamos los mas viejos).

Selección FSlint

Seleccionamos los archivos a borrar (todos menos el primero, los más nuevos o los más viejos)

Ahora solo nos queda decidir que hacer con ellos, podemos borrarlos, con el botón “Eliminar” o con el botón  “Combinar” reemplazar los duplicados con enlaces duros.

También podemos guardar la lista de los archivos duplicados.

Según este blog el procedimiento para hallar duplicados es este:

“El algoritmo empleado para detetrminar si un archivo está duplicado o no
es verdaderamente minucionso, para evitar falsos positivos, que te lleven a pérdida de inforamción. FSlint, busca en tu máquina, descartando en primer lugar aquellos archivos con tamaao único. De los archivos que queda comprueba que ninguno tenga un enlace duro. Igualmente, de los que quedan realiza varias comprobaciones con md5 (primero parte del archivo, y en caso de duda el archivo completo). Por último para evitar posibles problemas con md5, comprueba los archivos restantes con sha1sum”

Sorprendentemente es bastante rápido, aún al momento de realizar la búsqueda en mi directorio de Música de unos 50 GB de espacio ocupado.

Por último podemos seleccionar la pestaña de “Directorios vacíos” para mejorar la limpieza.

Otras opciones, mejor explicadas y el uso desde la linea de comandos en El Atareao

2 pensamientos en “Eliminando archivos duplicados

  1. Bueno, estoy en ello, y lo de rápido….veo que a mi no me está funcionando del todo bien, me va lento en extremos, no sé no es graan pc, pero 4 GiB de RAM dual core….

    pero bueno, aunque tarde…lo dejo por la noche…. la prueba con una carpeta cumple en condiciones.

    • Gracias por comentar.
      Al momento de escribir el post lo utilicé buscando duplicados de algunas fotos, páginas web y archivos .mp3 (en ambos casos sobre varios GB de información). Corrí el test sobre una PC con menos prestaciones que esa, aunque creo que lo determinante debe ser el disco rígido (rpm e interfaz) más que la memoria y CPU.
      Si bien no recuerdo tiempos (estoy seguro que no sobrepasaban la hora) me sorprendió que demorara poco para la cantidad de comprobaciones que dice realizar.

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s