GNU Wget es una utilidad que sirve para “bajar” archivos de internet por medio de los protocolos HTTP o FTP. Por ser GNU es código abierto, por lo tanto su código se puede descargar de www.gnu.org.
GNU Wget nos permite descargar un sitio web recursivamente, es decir, puede actuar como un web crawler y descargar de cada página, las páginas de los enlaces que encuentra y así sucesivamente por cada página hasta el infinito, o bien, hasta un nivel de recursividad dado.
Veamos algunos ejemplos:
wget www.ubuntu.comwget -r -l2 www.ubuntu.comwget -r -l2 -N www.ubuntu.comwget -m www.ubuntu.com o wget -r -l0 -N www.ubuntu.comwget -r -l -np www.ubuntu.com (-np indica que no ascienda a directorios superiores)
Los archivos descargados quedan guardados en una estructura de directorios igual a la del sitio web descargado, aunque esto también se puede cambiar por medio de otros argumentos.
Para ver todos los argumentos y las opciones del programa, ejecuta wget --help o wget -help
Si utilizas Windows puedes descargarlo de aqui. Si utilizas Linux o alguna variante de UNIX probablemente lo tengas instalado, caso contrario puedes descargar los fuentes o los binarios del sitio oficial. Si tu Linux es un Debian: $ sudo apt-get install wget
3 Respuestas para "Descargar un sitio web completo"
[...] para descargar archivos: el comando wget es un comando multipropósito, puedes utilizarlo para descargar todo un sitio, un archivo en particular y mucho [...]
[...] se compara con un pequeño shell script escrito en bash que solo requiere que tengas instalado el wget. Con este script, descargar un video es tan simple como ejecutar el nombre del script y la URL del [...]
solo necesito descargar el codigo fuente de una pagina web que tiene html y php pero no me interesa los enlaces a documentos pdf y word que estan enlazados a la pagina, me recomendaron usar WGET , me pueden ayudar indicandome que opciones de wget usar para conseguir esto, ya que el sitio del que quiero hacer un mirror es de prueba, y no me interesa tener todos el sitio completo.
gracias
Comentarios: