Home Ubuntu Blog de Software libre Artículos YouTube Contactar Empresas Basicos ¿Ubuntu?

   Bajarse una web entera

 

Comandos
Bajarse una web entera con linux es muy sencillo.Simplemente has de abrir una consola y escribir wget -r paginaweb.Por ejemplo para bajarse esta web,seria:

wget -r -k http://tuxhuellas.bitacoras.com/

tb puedes poner a bajar varias web a la vez.Para ello escribe las direcciones en un fichero de texto (xejemplo:websadercargar.txt)y luego ejecuta el comando asi:

wget -r -i webadescargas.txt

Facil,no?pues a probarlo ;)

Autor: Atreliz | Fecha:Tuesday, 7 Mar 2006 |
Emblemas: Internet | 9 Notas

   Post relacionados

  1. El Evangelio de Tux
  2. ...
  3. Truquillos en Gnome
  4. ...

 

      9 comentarios a ' Bajarse una web entera '


    1. Este post es de los qeu estoy exportando poco desde “primera huellas” pero he pensado qeu lo de firmarlos debajo diciendo qeu son exportados y tal..es un rollo..asiq eu aprtir de ahora,sin rollo,ok?

      Por cierrto qeu creo qu recordar,qeu Busindre tb trata este tema en su resumen de linux.(y ademas mas completo)


     Autor:Atreliz


    1. he intentado bajar una pagina con el comando y parece que no baja sino las carpetas
      por ejemplo:
      wget -r -k http://agora.pucp.edu.pe/ftp/pub/linux/videos/tutor_install/ubuntu/ubuntu.html

      solo baja las carpetas y el htm principal pero no los archivos.


     Autor:william


    1. Bueno es qeu lo qeu dices es un video,no funciona,en web hechas en flash,ni en las protegidas,y menos aun en videos claro…
      Pero ese video me sonaba..asi qeu te he buscado la web original de donde proceden.Y desde ella puedes descargarlo sin problemas,ese muchos mas,aunq has de registrarte,es muy rapido.
      http://opensourcespot.org/


     Autor:Atreliz


    1. wget
      —-
      Gestor de descargas (si pide autorizacion–http-user –http-passwd), s –mirror, -X para excluir las sources, -l solo entra en los links locales, cosa muy util.

      Para descargar un fichero indefinido de veces (-t 0),retomando la descarga en la proxima ejecucion si se corta la conexion o se para el programa (-c), identificandose como un navegador web normal para evitar ser detectado por servidores (-U “Mozilla”) y no identificandose como un robot para tener acceso completo
      a las paginas (-erobot=off), auque algunas estan protegidas contra descargas abusibas.

      wget -t 0 -c -U “Mozilla” http://www.playboy.com/virus.zip

      Para descargar completamente una pagina (-r) y convertir los enlaces para verla localmente (-k):
      wget -t 0 -c -U “Mozilla” -erobot=off -r -k http://xxx.unizar.es

      Para descargar la lista de enlaces de un fichero urls.txt:
      wget -i urls.txt

      Para aceptar solamente los ficheros JPG y MPG (-A *.jpg,*.mpg):
      wget -t 0 -c -U “Mozilla” -erobot=off -r -k -A *.wmv,*.mpg,*.avi,*.mpeg http://www.fotos_y_videos_guarros.es

      Bajar el directorio completo:
      wget -r -A=.html,.deb -nc -np http://www.debian.org/~jules/gnome-stage-2/dists/

      NOTA: Si bajas una serie de archivos html que en su contenido incluyen vinculos a otras paginas html, el WGET cambia las url’s y las adapta a tu maquina local, de manera que puedes navegar en los archivos que bajaste y en sus vinculos sin necesidad de estar conectado a la WEB.

      /////////////////////////////////////////////////

      Un saludo


     Autor:Busindre


    1. La web de http://www.fotos_y_videos_guarros.es no me tira :P jajajjajja


     Autor:Atreliz


    1. Buenas!
      Sabeis como seria el comando para bajar de una web entera archivos que solamente fueran mas grandes por ejemplo de 600 megas?
      Gracias por adelantado! :)


     Autor:viodream


    1. Bueno, eso que pides exactamente creo que no se puede, pero bueno siempre puedes hacer un script que una vez baje, filtre por tamaño. De todas maneras hay una opcion en wget que es -Q quota / –quota=quota
      que sirve para cortar la descarga si se llega a cierta cantidad de megas/kb,.. Solo lo comento a modo de curiosidad. Hay un programa llamado Fwget que por lo visto consume menos y da mejores resultados en descargar recursivas de web, no lo he probado, pero os lo comento ;) .

      Un saludo


     Autor:Busindre


    1. hola. tengo un problema. quiero bajar una pagina completa con el terminal de linux, y quisiera saber si es una buena forma el hacerlo con la opcion wget. aun y asi, no se utilizarla. agradeceria la ayuda


     Autor:necesito_ayuda


    1. No necesitas ayuda, necesitas leer las 8 lineas del post,.. 8)


     Autor:Busindre

 

   Poner un comentario

    :wink: :-| :-x :twisted: :) 8-O :( :roll: :-P :oops: :-o :mrgreen: :lol: :idea: :-D :evil: :cry: 8) :arrow: :-? :?: :!:


 

Creative Commons License
Todo el contenido de este blog se encuentra bajo licencia de Creative Commons.


[x] Cerrar
E-mail