Qué es Wget: comando, opciones y parámetros de Wget

Qué es Wget: comando, opciones y parámetros

Wget es una herramienta utilizada a través de línea de comandos que permite descargar archivos mediante los protocolos web más utilizados (HTTP, HTTPS, FTP y FTPS). Se usa principalmente en sistemas derivados de UNIX y lo habitual es manejarla cuando trabajamos con servidores, ya que nos facilita tratar con archivos de un modo cómodo directamente desde la consola, desde nuestros scripts o programando tareas cron en el backend de nuestro proveedor de hosting.

Lo que vamos a ver a continuación es el listado completo de opciones y parámetros que podemos usar con el comando wget. Este listado lo he extraído de la ayuda que ofrece el propio Wget y que me resulta de especial interés como tabla de consulta cuando estoy trabajando. Como extrañamente no lo he encontrado subido a internet tal cual, me he animado a hacerlo yo y espero que os resulte de ayuda para vuestras consultas.

Modo de empleo: wget [OPCIÓN]… [URL]…

Los argumentos obligatorios para las opciones largas son también obligatorios para las opciones cortas. Estos parámetros se encuentran indicados en mayúsculas para que los puedas identificar y sustituir rápidamente.

Inicio:

-V, --version | Muestra la versión de Wget y sale.
-h, --help | Muestra esta ayuda.
-b, --background | Ir a segundo plano después de empezar.
-e, --execute=COMANDO | Ejecuta una orden estilo ‘.wgetrc’.

Ficheros de registro y de entrada:

-o, --output-file=ARCHIVO | Registrar mensajes en ARCHIVO.
-a, --append-output=ARCHIVO | Anexar mensajes a ARCHIVO.
-d, --debug | Saca montones de información para depuración.
-q, --quiet | Silencioso (sin texto de salida).
-v, --verbose | Sé verboso (es el método por defecto).
-nv, --no-verbose | Desactiva modo verboso, sin ser silencioso.
--report-speed=TIPO | Ancho de banda de salida como TIPO. TIPO pueden ser bits.
-i, --input-file=ARCHIVO | Descarga URLs encontradas en fichero (ARCHIVO) local o externo.
-F, --force-html | Trata el fichero de entrada como HTML.
-B, --base=URL | Resuelve enlaces HTML del fichero-de-entrada (-i -F) relativos a la URL.
--config=ARCHIVO | Especifica el archivo de configuración que se utilizará.

Descarga:

-t, --tries=NÚMERO | Define número de intentos a NÚMERO (0 es sin limite).
--retry-connrefused | Reintentar incluso si la conexión es rechazada.
-O, --output-document=ARCHIVO | Escriba documentos al fichero ARCHIVO.
-nc, --no-clobber | SOmita las descargas que se descargarían en archivos existentes (sobrescribiéndolos).
-c, --continue | Continuar una descarga parcial de un fichero.
--progress=TIPO | Selecciona tipo de indicador de progreso.
-N, --timestamping | No re-recuperar ficheros a menos que sean más nuevos que la versión local.
--no-use-server-timestamps | No poner la hora/fecha del fichero local a la que tenga el del servidor.
-S, --server-response | Mostrar la respuesta del servidor.
--spider | (araña) no descargar nada.
-T, --timeout=SEGUNDOS | Poner todos los valores de temporización a SEGUNDOS.
--dns-timeout=SEGS | Definir la temporización de la búsqueda DNS a SEGS.
--connect-timeout=SEGS | Definir la temporización de conexión a SEGS.
--read-timeout=SEGS | Definir la temporización de lectura a SEGS.
-w, --wait=SEGUNDOS | Espera tantos SEGUNDOS entre reintentos.
--waitretry=SEGUNDOS | Espera 1..SEGUNDOS entre reintentos de una descarga.
--random-wait | Espera entre 0.5*WAIT…1.5*WAIT segs. entre descargas.
--no-proxy | Explícitamente desconecta el proxy.
-Q, --quota=NÚMERO | Define la cuota de descarga a NÚMERO.
--bind-address=DIRECCIÓN | Bind a DIRECCIÓN (nombredeequipo o IP) en equipo local.
--limit-rate=VELOCIDAD | Limita velocidad de descarga a VELOCIDAD.
--no-dns-cache | Desactiva búsquedas en tampón DNS.
--restrict-file-names=OS | Restringe caracteres en nombres de ficheros a los que el SO permita.
--ignore-case | Ignorar mayús/minúsculas al encajar ficheros/directorios.
-4, --inet4-only | Conectar sólo a direcciones IPv4.
-6, --inet6-only | Conectar sólo a direcciones IPv6.
--prefer-family=FAMILY | Conectar primero a direcciones de la familia especificada, bien IPv6, IPv4, o ninguna.
--user=USUARIO | Poner el usuario de ambos ftp y http a USUARIO.
--password=CONTRASEÑA | Poner la contraseña de ambos ftp y http a CONTRASEÑA.
--ask-password | Pedir las contraseñas.
--no-iri | Desactivar soporte IRI.
--local-encoding=ENC | Usar codificación ENC como la codificación local para IRIs.
--remote-encoding=ENC | Usar ENC como la codificación remota por defecto.
--unlink | Remove file before clobber.

Directorios:

-nd, --no-directories | No crear directorios.
-x, --force-directories | Forzar la creación de directorios.
-nH, --no-host-directories | No crear directorios del anfitrión.
--protocol-directories | Use nombre de protocolo en los directorios.
-P, --directory-prefix=PREFIX | Grabar los ficheros en PREFIX/…
--cut-dirs=NÚMERO | Ignorar NÚMERO de componentes de directorio remoto.

Opciones HTTP:

--http-user=USUARIO | Poner el usuario http a USUARIO.
--http-password=PASS | Poner la contraseña http a PASS.
--no-cache | No permitir los datos en tampón del servidor.
--default-page=NAME | Cambiar el nombre de página por defecto (suele ser ‘index.html’.).
-E, --adjust-extension | Grabe documentos HTML/CSS con las extensiones correctas.
--ignore-length | Ignorar campo ‘Content-Length’ en cabeceras .
--header=STRING | Insertar STRING entre las cabeceras.
--max-redirect | Máximo de redirecciones permitidas por página.
--proxy-user=USUARIO | poner USUARIO como nombre de usuario del proxy.
--proxy-password=PASS | Poner PASS como contraseña del proxy.
--referer=URL | Incluir cabecera ‘Referer: URL’ en petición HTTP.
--save-headers | Grabar las cabeceras HTTP a fichero.
-U, --user-agent=AGENTE | Identificarse como AGENTE en vez de Wget/VERSIÓN.
--no-http-keep-alive | Desactivar HTTP keep-alive (conexiones persistentes).
--no-cookies | No usar «cookies».
--load-cookies=FICHERO | Cargar las «cookies» desde FICHERO antes de la sesión.
--save-cookies=FICHERO | Grabar las «cookies» a FICHERO después de la sesión.
--keep-session-cookies | Cargar y grabar las «cookies» de sesión (no-permanentes).
--post-data=STRING | Usar el método POST; enviar STRING como los datos.
--post-file=FICHERO | Usar el método POST; envía el contenido de FICHERO.
--content-disposition | Cumplir con la cabecera Content-Disposition cuando se elige nombre de ficheros locales (EXPERIMENTAL).
--content-on-error | Output the received content on server errors.
--auth-no-challenge | Enviar información de autenticicación básica HTTP sin antes esperar al desafío del servidor.

Opciones HTTPS (SSL/TLS):

--secure-protocol=PR | Elija un protocolo seguro, uno de auto, SSLv2, SSLv3, TLSv1, TLSv1_1 y TLSv1_2.
--no-check-certificate | No validar el certificado del servidor.
--certificate=FILE | Fichero de certificado del cliente.
--certificate-type=TYPE | Fipo de certificado de cliente, PEM o DER.
--private-key=FILE | Fichero de llave privada.
--private-key-type=TYPE | Tipo de llave privada, PEM o DER.
--ca-certificate=FILE | Fichero con la agrupación de CAs.
--ca-directory=DIR | Directorio donde se guarda la lista «hash» de CAs.
--random-file=FILE | Fichero con datos aleatorios como semilla de SSL PRNG.
--egd-file=FICHERO | Fichero que denomina el conector EGD con datos aleatorios.

Opciones FTP:

--ftp-user=USUARIO | Poner USUARIO como el usuario de ftp.
--ftp-password=PASS | Poner PASS como contraseña ftp.
--no-remove-listing | No eliminar los ficheros ‘.listing’.
--no-glob | Desactivar con Wget la generación de nombres de fichero del FTP (globbing).
--no-passive-ftp | Desactivar el modo «pasivo» de transferencia.
--preserve-permissions | Preservar permisos de archivos remotos.
--retr-symlinks | En modo recursivo, bajar los ficheros enlazados (no los directorios).

Opciones WARC:

--warc-file=FILENAME | Save request/response data to a .warc.gz file.
--warc-header=STRING | Insert STRING into the warcinfo record.
--warc-max-size=NUMBER | Set maximum size of WARC files to NUMBER.
--warc-cdx | write CDX index files.
--warc-dedup=FILENAME | do not store records listed in this CDX file.
--no-warc-compression | do not compress WARC files with GZIP.
--no-warc-digests | do not calculate SHA1 digests.
--no-warc-keep-log | do not store the log file in a WARC record.
--warc-tempdir=DIRECTORY | location for temporary files created by the WARC writer.

Bajada recursiva:

-r, --recursive | Especificar descarga recursiva.
-l, --level=NUMBER | Máxima profundidad de recursión (inf o 0 para infinita).
--delete-after | Borrar los ficheros localmente después de descargarlos.
-k, --convert-links | Hacer que los enlaces en el HTML o CSS descargado apunte a ficheros locales.
--backups=N | Before writing file X, rotate up to N backup files.
-K, --backup-converted | Antes de convertir el fichero X, salvaguardarlo como X.orig.
-m, --mirror | Atajo para -N -r -l inf –no-remove-listing en Wget.
-p, --page-requisites | Bajar todas las imágenes, etc. que se necesitan para mostrar la página HTML.
--strict-comments | Activar manejo stricto (SGML) de los comentarios en HTML.

Aceptar/rechazar recursivamente:

-A, --accept=LIST | Lista separada por comas de extensiones aceptadas.
-R, --reject=LIST | Lista separada por comas de extensiones rechazadas.
--accept-regex=REGEX | regex matching accepted URLs.
--reject-regex=REGEX | regex matching rejected URLs.
--regex-type=TYPE | regex type (posix|pcre).
-D, --domains=LIST | Lista separada por comas de dominios aceptados.
--exclude-domains=LIST | Lista separada por comas de dominios rechazados.
--follow-ftp | Seguir los enlaces a FTP de los documentos HTML.
--follow-tags=LIST | Lista separada por comas de etiquetas HTML a seguir.
--ignore-tags=LIST | Lista separada por comas de etiquetas HTML a ignorar.
-H, --span-hosts | Ir a equipos extraños en el recorrido recursivo.
-L, --relative | Sólo seguir enlaces relativos.
-I, --include-directories=LIST | Lista de directorios permitidos.
--trust-server-names | Utiliza el nombre especificado por el último componente de la URL de redirección.
-X, --exclude-directories=LIST | Lista de directorios excluidos.
-np, --no-parent | No ascender al directorio padre.

Si quieres ampliar información, puedes consultar el manual de GNU Wget.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *