Descargar un sitio web completo

GNU Wget es una utilidad que sirve para “bajar” archivos de internet por medio de los protocolos HTTP o FTP. Por ser GNU es código abierto, por lo tanto su código se puede descargar de www.gnu.org.

GNU Wget nos permite descargar un sitio web recursivamente, es decir, puede actuar como un web crawler y descargar de cada página, las páginas de los enlaces que encuentra y así sucesivamente por cada página hasta el infinito, o bien, hasta un nivel de recursividad dado.

Veamos algunos ejemplos:

Los archivos descargados quedan guardados en una estructura de directorios igual a la del sitio web descargado, aunque esto también se puede cambiar por medio de otros argumentos.

Para ver todos los argumentos y las opciones del programa, ejecuta wget --help o wget -help

Si utilizas Windows puedes descargarlo de aqui. Si utilizas Linux o alguna variante de UNIX probablemente lo tengas instalado, caso contrario puedes descargar los fuentes o los binarios del sitio oficial. Si tu Linux es un Debian: $ sudo apt-get install wget

Tags: , ,


Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.