Eliminar archivos innecesarios al guardar páginas webs

Suelo bajar varias páginas que me parecen interesantes para leerlas luego o para almacenarlas en el disco, previendo que no vuelva a dar con ellas. Básicamente le mando Ctrl+S a todo lo que me parece que vale la pena.

El problema es que se me llena el disco de porquerías. Cientos de archivos .js, .css, banners de publicidad, emoticones, avatares de usuarios, etc.

Si bien cada archivo de estos pesa unos pocos bytes o kbytes, ocupan todo un bloque (al menos en sistemas de archivos sin sub-asignación de bloques), incrementando el espacio que se desperdicia en el disco y en conjunto pueden llegar a ocupar algunos gigas del disco.

La idea es eliminar todos esos archivos dejando solo los necesarios: por supuesto el html, algún .css, y de las imágenes (.jpg o .png) solo los archivos más grandes.

1) Borramos todos los archivos que no sean .jpg, .png, .css o .html. Usando -iname hacemos que find no distinga entre mayúsculas y minúsculas, dejando tanto los archivos .html como los .HTML. (Se podría refinar incluyendo .htm, .php y otros más que resulten de interés).

find ./ -type f ! -iname *.html ! -iname *.css ! -iname *.jpg ! -iname *.png -exec rm -f {} \;

2) Borramos todas las imágenes cuyo tamaño sea menor a 30K (íconos, avatares, emoticones).

find ./ -type f -iname *.jpg -iname *.png -size -30k -exec rm -f {} \;

3) Borramos todos los directorios que hayan quedado vacíos.

find ./ -type d -empty -exec rmdir {} \;

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s