Qué es Wget: comando, opciones y parámetros de Wget

Qué es Wget: comando, opciones y parámetros

18 de enero 2021

Wget es una herramienta utilizada a traves de línea de comandos que permite descargar archivos mediante los protocolos web más utilizados (HTTP, HTTPS, FTP y FTPS). Se usa principalmente en sistemas derivados de UNIX y lo habitual es manejarla cuando trabajamos con servidores, ya que nos facilita tratar con archivos de un modo cómodo directamente desde la consola, desde nuestros scripts o programando tareas cron en el backend de nuestro proveedor de hosting.

Lo que vamos a ver a continuación es el listado completo de opciones y parámetros que podemos usar con el comando wget. Este listado lo he extraído de la ayuda que ofrece el propio Wget y que me resulta de especial interés como tabla de consulta cuando estoy trabajando. Como extrañamente no lo he encontrado subido a internet tal cual, me he animado a hacerlo yo y espero que os resulte de ayuda para vuestras consultas.

Modo de empleo: wget [OPCIÓN]… [URL]…

Los argumentos obligatorios para las opciones largas son también obligatorios para las opciones cortas. Estos parámetros se encuentran indicados en mayúsculas para que los puedas identificar y sustituir rápidamente.

Inicio:

-V, --version | Muestra la versión de Wget y sale.
-h, --help | Muestra esta ayuda.
-b, --background | Ir a segundo plano después de empezar.
-e, --execute=COMANDO | Ejecuta una orden estilo ‘.wgetrc’.

Ficheros de registro y de entrada:

-o, --output-file=ARCHIVO | Registrar mensajes en ARCHIVO.
-a, --append-output=ARCHIVO | Anexar mensajes a ARCHIVO.
-d, --debug | Saca montones de información para depuración.
-q, --quiet | Silencioso (sin texto de salida).
-v, --verbose | Sé verboso (es el método por defecto).
-nv, --no-verbose | Desactiva modo verboso, sin ser silencioso.
--report-speed=TIPO | Ancho de banda de salida como TIPO. TIPO pueden ser bits.
-i, --input-file=ARCHIVO | Descarga URLs encontradas en fichero (ARCHIVO) local o externo.
-F, --force-html | Trata el fichero de entrada como HTML.
-B, --base=URL | Resuelve enlaces HTML del fichero-de-entrada (-i -F) relativos a la URL.
--config=ARCHIVO | Especifica el archivo de configuración que se utilizará.

Descarga:

-t, --tries=NÚMERO | Define número de intentos a NÚMERO (0 es sin limite).
--retry-connrefused | Reintentar incluso si la conexión es rechazada.
-O, --output-document=ARCHIVO | Escriba documentos al fichero ARCHIVO.
-nc, --no-clobber | SOmita las descargas que se descargarían en archivos existentes (sobrescribiéndolos).
-c, --continue | Continuar una descarga parcial de un fichero.
--progress=TIPO | Selecciona tipo de indicador de progreso.
-N, --timestamping | No re-recuperar ficheros a menos que sean más nuevos que la versión local.
--no-use-server-timestamps | No poner la hora/fecha del fichero local a la que tenga el del servidor.
-S, --server-response | Mostrar la respuesta del servidor.
--spider | (araña) no descargar nada.
-T, --timeout=SEGUNDOS | Poner todos los valores de temporización a SEGUNDOS.
--dns-timeout=SEGS | Definir la temporización de la búsqueda DNS a SEGS.
--connect-timeout=SEGS | Definir la temporización de conexión a SEGS.
--read-timeout=SEGS | Definir la temporización de lectura a SEGS.
-w, --wait=SEGUNDOS | Espera tantos SEGUNDOS entre reintentos.
--waitretry=SEGUNDOS | Espera 1..SEGUNDOS entre reintentos de una descarga.
--random-wait | Espera entre 0.5*WAIT…1.5*WAIT segs. entre descargas.
--no-proxy | Explícitamente desconecta el proxy.
-Q, --quota=NÚMERO | Define la cuota de descarga a NÚMERO.
--bind-address=DIRECCIÓN | Bind a DIRECCIÓN (nombredeequipo o IP) en equipo local.
--limit-rate=VELOCIDAD | Limita velocidad de descarga a VELOCIDAD.
--no-dns-cache | Desactiva búsquedas en tampón DNS.
--restrict-file-names=OS | Restringe caracteres en nombres de ficheros a los que el SO permita.
--ignore-case | Ignorar mayús/minúsculas al encajar ficheros/directorios.
-4, --inet4-only | Conectar sólo a direcciones IPv4.
-6, --inet6-only | Conectar sólo a direcciones IPv6.
--prefer-family=FAMILY | Conectar primero a direcciones de la familia especificada, bien IPv6, IPv4, o ninguna.
--user=USUARIO | Poner el usuario de ambos ftp y http a USUARIO.
--password=CONTRASEÑA | Poner la contraseña de ambos ftp y http a CONTRASEÑA.
--ask-password | Pedir las contraseñas.
--no-iri | Desactivar soporte IRI.
--local-encoding=ENC | Usar ccodificación ENC como la codificación local para IRIs.
--remote-encoding=ENC | Usar ENC como la codificación remota por defecto.
--unlink | Remove file before clobber.

Directorios:

-nd, --no-directories | No crear directorios.
-x, --force-directories | Forzar la creación de directorios.
-nH, --no-host-directories | No crear directorios del anfitrión.
--protocol-directories | Use nombre de protocolo en los directorios.
-P, --directory-prefix=PREFIX | Grabar los ficheros en PREFIX/…
--cut-dirs=NÚMERO | Ignorar NÚMERO de componentes de directorio remoto.

Opciones HTTP:

--http-user=USUARIO | Poner el usuario http a USUARIO.
--http-password=PASS | Poner la contraseña http a PASS.
--no-cache | No permitir los datos en tampón del servidor.
--default-page=NAME | Cambiar el nombre de página por defecto (suele ser ‘index.html’.).
-E, --adjust-extension | Grabe documentos HTML/CSS con las extensiones correctas.
--ignore-length | Ignorar campo ‘Content-Length’ en cabeceras .
--header=STRING | Insertar STRING entre las cabeceras.
--max-redirect | Máximo de redirecciones permitidas por página.
--proxy-user=USUARIO | poner USUARIO como nombre de usuario del proxy.
--proxy-password=PASS | Poner PASS como contraseña del proxy.
--referer=URL | Incluir cabecera `Referer: URL’ en petición HTTP.
--save-headers | Grabar las cabeceras HTTP a fichero.
-U, --user-agent=AGENTE | Identificarse como AGENTE en vez de Wget/VERSIÓN.
--no-http-keep-alive | Desactivar HTTP keep-alive (conexiones persistentes).
--no-cookies | No usar «cookies».
--load-cookies=FICHERO | Cargar las «cookies» desde FICHERO antes de la sesión.
--save-cookies=FICHERO | Grabar las «cookies» a FICHERO después de la sesión.
--keep-session-cookies | Cargar y grabar las «cookies» de sesión (no-permanentes).
--post-data=STRING | Usar el método POST; enviar STRING como los datos.
--post-file=FICHERO | Usar el método POST; envía el contenido de FICHERO.
--content-disposition | Cumplir con la cabecera Content-Disposition cuando se elige nombre de ficheros locales (EXPERIMENTAL).
--content-on-error | Output the received content on server errors.
--auth-no-challenge | Enviar información de autenticicación básica HTTP sin antes esperar al desafío del servidor.

Opciones HTTPS (SSL/TLS):

--secure-protocol=PR | Elija un protocolo seguro, uno de auto, SSLv2, SSLv3, TLSv1, TLSv1_1 y TLSv1_2.
--no-check-certificate | No validar el certificado del servidor.
--certificate=FILE | Fichero de certificado del cliente.
--certificate-type=TYPE | Fipo de certificado de cliente, PEM o DER.
--private-key=FILE | Fichero de llave privada.
--private-key-type=TYPE | Tipo de llave privada, PEM o DER.
--ca-certificate=FILE | Fichero con la agrupación de CAs.
--ca-directory=DIR | Directorio donde se guarda la lista «hash» de CAs.
--random-file=FILE | Fichero con datos aleatorios como semilla de SSL PRNG.
--egd-file=FICHERO | Fichero que denomina el conector EGD con datos aleatorios.

Opciones FTP:

--ftp-user=USUARIO | Poner USUARIO como el usuario de ftp.
--ftp-password=PASS | Poner PASS como contraseña ftp.
--no-remove-listing | No eliminar los ficheros ‘.listing’.
--no-glob | Desactivar generación de nombres de fichero del FTP (globbing).
--no-passive-ftp | Desactivar el modo «pasivo» de transferencia.
--preserve-permissions | Preserve remote file permissions.
--retr-symlinks | En modo recursivo, bajar los ficheros enlazados (no los directorios).

Opciones WARC:

--warc-file=FILENAME | Save request/response data to a .warc.gz file.
--warc-header=STRING | Insert STRING into the warcinfo record.
--warc-max-size=NUMBER | Set maximum size of WARC files to NUMBER.
--warc-cdx | write CDX index files.
--warc-dedup=FILENAME | do not store records listed in this CDX file.
--no-warc-compression | do not compress WARC files with GZIP.
--no-warc-digests | do not calculate SHA1 digests.
--no-warc-keep-log | do not store the log file in a WARC record.
--warc-tempdir=DIRECTORY | location for temporary files created by the WARC writer.

Bajada recursiva:

-r, --recursive | Especificar descarga recursiva.
-l, --level=NUMBER | Máxima profundidad de recursión (inf o 0 para infinita).
--delete-after | Borrar los ficheros localmente después de descargarlos.
-k, --convert-links | Hacer que los enlaces en el HTML o CSS descargado apunte a ficheros locales.
--backups=N | Before writing file X, rotate up to N backup files.
-K, --backup-converted | Antes de convertir el fichero X, salvaguardarlo como X.orig.
-m, --mirror | Atajo para -N -r -l inf –no-remove-listing.
-p, --page-requisites | Bajar todas las imágenes, etc. que se necesitan para mostrar la página HTML.
--strict-comments | Activar manejo stricto (SGML) de los comentarios en HTML.

Aceptar/rechazar recursivamente:

-A, --accept=LIST | Lista separada por comas de extensiones aceptadas.
-R, --reject=LIST | Lista separada por comas de extensiones rechazadas.
--accept-regex=REGEX | regex matching accepted URLs.
--reject-regex=REGEX | regex matching rejected URLs.
--regex-type=TYPE | regex type (posix|pcre).
-D, --domains=LIST | Lista separada por comas de dominios aceptados.
--exclude-domains=LIST | Lista separada por comas de dominios rechazados.
--follow-ftp | Seguir los enlaces a FTP de los documentos HTML.
--follow-tags=LIST | Lista separada por comas de etiquetas HTML a seguir.
--ignore-tags=LIST | Lista separada por comas de etiquetas HTML a ignorar.
-H, --span-hosts | Ir a equipos extraños en el recorrido recursivo.
-L, --relative | Sólo seguir enlaces relativos.
-I, --include-directories=LIST | Lista de directorios permitidos.
--trust-server-names | Utiliza el nombre especificado por el último componente de la URL de redirección.
-X, --exclude-directories=LIST | Lista de directorios excluidos.
-np, --no-parent | No ascender al directorio padre.

Si quieres ampliar información, puedes consultar el manual de GNU Wget.

Publicado por Jesús Tovar

Categorías: Programación, Recursos

Etiquetas: , , ,

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Desliza para verificar