Bajarse una web entera
Comandos
Bajarse una web entera con linux es muy sencillo.Simplemente has de abrir una consola y escribir wget -r paginaweb.Por ejemplo para bajarse esta web,seria:
tb puedes poner a bajar varias web a la vez.Para ello escribe las direcciones en un fichero de texto (xejemplo:websadercargar.txt)y luego ejecuta el comando asi:
Facil,no?pues a probarlo
Post relacionados
9 comentarios a ' Bajarse una web entera '
-
Este post es de los qeu estoy exportando poco desde “primera huellas” pero he pensado qeu lo de firmarlos debajo diciendo qeu son exportados y tal..es un rollo..asiq eu aprtir de ahora,sin rollo,ok?
Por cierrto qeu creo qu recordar,qeu Busindre tb trata este tema en su resumen de linux.(y ademas mas completo)
Autor:Atreliz
he intentado bajar una pagina con el comando y parece que no baja sino las carpetas
por ejemplo:
wget -r -k http://agora.pucp.edu.pe/ftp/pub/linux/videos/tutor_install/ubuntu/ubuntu.html
solo baja las carpetas y el htm principal pero no los archivos.
Autor:william
Bueno es qeu lo qeu dices es un video,no funciona,en web hechas en flash,ni en las protegidas,y menos aun en videos claro…
Pero ese video me sonaba..asi qeu te he buscado la web original de donde proceden.Y desde ella puedes descargarlo sin problemas,ese muchos mas,aunq has de registrarte,es muy rapido.
http://opensourcespot.org/
Autor:Atreliz
wget
—-
Gestor de descargas (si pide autorizacion–http-user –http-passwd), s –mirror, -X para excluir las sources, -l solo entra en los links locales, cosa muy util.
Para descargar un fichero indefinido de veces (-t 0),retomando la descarga en la proxima ejecucion si se corta la conexion o se para el programa (-c), identificandose como un navegador web normal para evitar ser detectado por servidores (-U “Mozilla”) y no identificandose como un robot para tener acceso completo
a las paginas (-erobot=off), auque algunas estan protegidas contra descargas abusibas.
wget -t 0 -c -U “Mozilla” http://www.playboy.com/virus.zip
Para descargar completamente una pagina (-r) y convertir los enlaces para verla localmente (-k):
wget -t 0 -c -U “Mozilla” -erobot=off -r -k http://xxx.unizar.es
Para descargar la lista de enlaces de un fichero urls.txt:
wget -i urls.txt
Para aceptar solamente los ficheros JPG y MPG (-A *.jpg,*.mpg):
wget -t 0 -c -U “Mozilla” -erobot=off -r -k -A *.wmv,*.mpg,*.avi,*.mpeg http://www.fotos_y_videos_guarros.es
Bajar el directorio completo:
wget -r -A=.html,.deb -nc -np http://www.debian.org/~jules/gnome-stage-2/dists/
NOTA: Si bajas una serie de archivos html que en su contenido incluyen vinculos a otras paginas html, el WGET cambia las url’s y las adapta a tu maquina local, de manera que puedes navegar en los archivos que bajaste y en sus vinculos sin necesidad de estar conectado a la WEB.
/////////////////////////////////////////////////
Un saludo
Autor:Busindre
La web de http://www.fotos_y_videos_guarros.es no me tira
jajajjajja
Autor:Atreliz
Buenas!
Sabeis como seria el comando para bajar de una web entera archivos que solamente fueran mas grandes por ejemplo de 600 megas?
Gracias por adelantado!
Autor:viodream
Bueno, eso que pides exactamente creo que no se puede, pero bueno siempre puedes hacer un script que una vez baje, filtre por tamaño. De todas maneras hay una opcion en wget que es -Q quota / –quota=quota
que sirve para cortar la descarga si se llega a cierta cantidad de megas/kb,.. Solo lo comento a modo de curiosidad. Hay un programa llamado Fwget que por lo visto consume menos y da mejores resultados en descargar recursivas de web, no lo he probado, pero os lo comento
.
Un saludo
Autor:Busindre
hola. tengo un problema. quiero bajar una pagina completa con el terminal de linux, y quisiera saber si es una buena forma el hacerlo con la opcion wget. aun y asi, no se utilizarla. agradeceria la ayuda
Autor:necesito_ayuda
No necesitas ayuda, necesitas leer las 8 lineas del post,..
Poner un comentario

Destacados
Random Post
Buscador
Meta



