Wget es una herramienta utilizada a través de línea de comandos que permite descargar archivos mediante los protocolos web más utilizados (HTTP, HTTPS, FTP y FTPS). Se usa principalmente en sistemas derivados de UNIX y lo habitual es manejarla cuando trabajamos con servidores, ya que nos facilita tratar con archivos de un modo cómodo directamente desde la consola, desde nuestros scripts o programando tareas cron en el backend de nuestro proveedor de hosting.
Lo que vamos a ver a continuación es el listado completo de opciones y parámetros que podemos usar con el comando wget. Este listado lo he extraído de la ayuda que ofrece el propio Wget y que me resulta de especial interés como tabla de consulta cuando estoy trabajando. Como extrañamente no lo he encontrado subido a internet tal cual, me he animado a hacerlo yo y espero que os resulte de ayuda para vuestras consultas.
Modo de empleo: wget [OPCIÓN]… [URL]…
Los argumentos obligatorios para las opciones largas son también obligatorios para las opciones cortas. Estos parámetros se encuentran indicados en mayúsculas para que los puedas identificar y sustituir rápidamente.
Inicio:
-V, --version | Muestra la versión de Wget y sale.-h, --help | Muestra esta ayuda.-b, --background | Ir a segundo plano después de empezar.-e, --execute=COMANDO | Ejecuta una orden estilo ‘.wgetrc’.
Ficheros de registro y de entrada:
-o, --output-file=ARCHIVO | Registrar mensajes en ARCHIVO.-a, --append-output=ARCHIVO | Anexar mensajes a ARCHIVO.-d, --debug | Saca montones de información para depuración.-q, --quiet | Silencioso (sin texto de salida).-v, --verbose | Sé verboso (es el método por defecto).-nv, --no-verbose | Desactiva modo verboso, sin ser silencioso.--report-speed=TIPO | Ancho de banda de salida como TIPO. TIPO pueden ser bits.-i, --input-file=ARCHIVO | Descarga URLs encontradas en fichero (ARCHIVO) local o externo.-F, --force-html | Trata el fichero de entrada como HTML.-B, --base=URL | Resuelve enlaces HTML del fichero-de-entrada (-i -F) relativos a la URL.--config=ARCHIVO | Especifica el archivo de configuración que se utilizará.
Descarga:
-t, --tries=NÚMERO | Define número de intentos a NÚMERO (0 es sin limite).--retry-connrefused | Reintentar incluso si la conexión es rechazada.-O, --output-document=ARCHIVO | Escriba documentos al fichero ARCHIVO.-nc, --no-clobber | SOmita las descargas que se descargarían en archivos existentes (sobrescribiéndolos).-c, --continue | Continuar una descarga parcial de un fichero.--progress=TIPO | Selecciona tipo de indicador de progreso.-N, --timestamping | No re-recuperar ficheros a menos que sean más nuevos que la versión local.--no-use-server-timestamps | No poner la hora/fecha del fichero local a la que tenga el del servidor.-S, --server-response | Mostrar la respuesta del servidor.--spider | (araña) no descargar nada.-T, --timeout=SEGUNDOS | Poner todos los valores de temporización a SEGUNDOS.--dns-timeout=SEGS | Definir la temporización de la búsqueda DNS a SEGS.--connect-timeout=SEGS | Definir la temporización de conexión a SEGS.--read-timeout=SEGS | Definir la temporización de lectura a SEGS.-w, --wait=SEGUNDOS | Espera tantos SEGUNDOS entre reintentos.--waitretry=SEGUNDOS | Espera 1..SEGUNDOS entre reintentos de una descarga.--random-wait | Espera entre 0.5*WAIT…1.5*WAIT segs. entre descargas.--no-proxy | Explícitamente desconecta el proxy.-Q, --quota=NÚMERO | Define la cuota de descarga a NÚMERO.--bind-address=DIRECCIÓN | Bind a DIRECCIÓN (nombredeequipo o IP) en equipo local.--limit-rate=VELOCIDAD | Limita velocidad de descarga a VELOCIDAD.--no-dns-cache | Desactiva búsquedas en tampón DNS.--restrict-file-names=OS | Restringe caracteres en nombres de ficheros a los que el SO permita.--ignore-case | Ignorar mayús/minúsculas al encajar ficheros/directorios.-4, --inet4-only | Conectar sólo a direcciones IPv4.-6, --inet6-only | Conectar sólo a direcciones IPv6.--prefer-family=FAMILY | Conectar primero a direcciones de la familia especificada, bien IPv6, IPv4, o ninguna.--user=USUARIO | Poner el usuario de ambos ftp y http a USUARIO.--password=CONTRASEÑA | Poner la contraseña de ambos ftp y http a CONTRASEÑA.--ask-password | Pedir las contraseñas.--no-iri | Desactivar soporte IRI.--local-encoding=ENC | Usar codificación ENC como la codificación local para IRIs.--remote-encoding=ENC | Usar ENC como la codificación remota por defecto.--unlink | Remove file before clobber.
Directorios:
-nd, --no-directories | No crear directorios.-x, --force-directories | Forzar la creación de directorios.-nH, --no-host-directories | No crear directorios del anfitrión.--protocol-directories | Use nombre de protocolo en los directorios.-P, --directory-prefix=PREFIX | Grabar los ficheros en PREFIX/…--cut-dirs=NÚMERO | Ignorar NÚMERO de componentes de directorio remoto.
Opciones HTTP:
--http-user=USUARIO | Poner el usuario http a USUARIO.--http-password=PASS | Poner la contraseña http a PASS.--no-cache | No permitir los datos en tampón del servidor.--default-page=NAME | Cambiar el nombre de página por defecto (suele ser ‘index.html’.).-E, --adjust-extension | Grabe documentos HTML/CSS con las extensiones correctas.--ignore-length | Ignorar campo ‘Content-Length’ en cabeceras .--header=STRING | Insertar STRING entre las cabeceras.--max-redirect | Máximo de redirecciones permitidas por página.--proxy-user=USUARIO | poner USUARIO como nombre de usuario del proxy.--proxy-password=PASS | Poner PASS como contraseña del proxy.--referer=URL | Incluir cabecera ‘Referer: URL’ en petición HTTP.--save-headers | Grabar las cabeceras HTTP a fichero.-U, --user-agent=AGENTE | Identificarse como AGENTE en vez de Wget/VERSIÓN.--no-http-keep-alive | Desactivar HTTP keep-alive (conexiones persistentes).--no-cookies | No usar «cookies».--load-cookies=FICHERO | Cargar las «cookies» desde FICHERO antes de la sesión.--save-cookies=FICHERO | Grabar las «cookies» a FICHERO después de la sesión.--keep-session-cookies | Cargar y grabar las «cookies» de sesión (no-permanentes).--post-data=STRING | Usar el método POST; enviar STRING como los datos.--post-file=FICHERO | Usar el método POST; envía el contenido de FICHERO.--content-disposition | Cumplir con la cabecera Content-Disposition cuando se elige nombre de ficheros locales (EXPERIMENTAL).--content-on-error | Output the received content on server errors.--auth-no-challenge | Enviar información de autenticicación básica HTTP sin antes esperar al desafío del servidor.
Opciones HTTPS (SSL/TLS):
--secure-protocol=PR | Elija un protocolo seguro, uno de auto, SSLv2, SSLv3, TLSv1, TLSv1_1 y TLSv1_2.--no-check-certificate | No validar el certificado del servidor.--certificate=FILE | Fichero de certificado del cliente.--certificate-type=TYPE | Fipo de certificado de cliente, PEM o DER.--private-key=FILE | Fichero de llave privada.--private-key-type=TYPE | Tipo de llave privada, PEM o DER.--ca-certificate=FILE | Fichero con la agrupación de CAs.--ca-directory=DIR | Directorio donde se guarda la lista «hash» de CAs.--random-file=FILE | Fichero con datos aleatorios como semilla de SSL PRNG.--egd-file=FICHERO | Fichero que denomina el conector EGD con datos aleatorios.
Opciones FTP:
--ftp-user=USUARIO | Poner USUARIO como el usuario de ftp.--ftp-password=PASS | Poner PASS como contraseña ftp.--no-remove-listing | No eliminar los ficheros ‘.listing’.--no-glob | Desactivar con Wget la generación de nombres de fichero del FTP (globbing).--no-passive-ftp | Desactivar el modo «pasivo» de transferencia.--preserve-permissions | Preservar permisos de archivos remotos.--retr-symlinks | En modo recursivo, bajar los ficheros enlazados (no los directorios).
Opciones WARC:
--warc-file=FILENAME | Save request/response data to a .warc.gz file.--warc-header=STRING | Insert STRING into the warcinfo record.--warc-max-size=NUMBER | Set maximum size of WARC files to NUMBER.--warc-cdx | write CDX index files.--warc-dedup=FILENAME | do not store records listed in this CDX file.--no-warc-compression | do not compress WARC files with GZIP.--no-warc-digests | do not calculate SHA1 digests.--no-warc-keep-log | do not store the log file in a WARC record.--warc-tempdir=DIRECTORY | location for temporary files created by the WARC writer.
Bajada recursiva:
-r, --recursive | Especificar descarga recursiva.-l, --level=NUMBER | Máxima profundidad de recursión (inf o 0 para infinita).--delete-after | Borrar los ficheros localmente después de descargarlos.-k, --convert-links | Hacer que los enlaces en el HTML o CSS descargado apunte a ficheros locales.--backups=N | Before writing file X, rotate up to N backup files.-K, --backup-converted | Antes de convertir el fichero X, salvaguardarlo como X.orig.-m, --mirror | Atajo para -N -r -l inf –no-remove-listing en Wget.-p, --page-requisites | Bajar todas las imágenes, etc. que se necesitan para mostrar la página HTML.--strict-comments | Activar manejo stricto (SGML) de los comentarios en HTML.
Aceptar/rechazar recursivamente:
-A, --accept=LIST | Lista separada por comas de extensiones aceptadas.-R, --reject=LIST | Lista separada por comas de extensiones rechazadas.--accept-regex=REGEX | regex matching accepted URLs.--reject-regex=REGEX | regex matching rejected URLs.--regex-type=TYPE | regex type (posix|pcre).-D, --domains=LIST | Lista separada por comas de dominios aceptados.--exclude-domains=LIST | Lista separada por comas de dominios rechazados.--follow-ftp | Seguir los enlaces a FTP de los documentos HTML.--follow-tags=LIST | Lista separada por comas de etiquetas HTML a seguir.--ignore-tags=LIST | Lista separada por comas de etiquetas HTML a ignorar.-H, --span-hosts | Ir a equipos extraños en el recorrido recursivo.-L, --relative | Sólo seguir enlaces relativos.-I, --include-directories=LIST | Lista de directorios permitidos.--trust-server-names | Utiliza el nombre especificado por el último componente de la URL de redirección.-X, --exclude-directories=LIST | Lista de directorios excluidos.-np, --no-parent | No ascender al directorio padre.
Si quieres ampliar información, puedes consultar el manual de GNU Wget.






Deja una respuesta