Wget es una herramienta utilizada a través de línea de comandos que permite descargar archivos mediante los protocolos web más utilizados (HTTP, HTTPS, FTP y FTPS). Se usa principalmente en sistemas derivados de UNIX y lo habitual es manejarla cuando trabajamos con servidores, ya que nos facilita tratar con archivos de un modo cómodo directamente desde la consola, desde nuestros scripts o programando tareas cron en el backend de nuestro proveedor de hosting.
Lo que vamos a ver a continuación es el listado completo de opciones y parámetros que podemos usar con el comando wget
. Este listado lo he extraído de la ayuda que ofrece el propio Wget y que me resulta de especial interés como tabla de consulta cuando estoy trabajando. Como extrañamente no lo he encontrado subido a internet tal cual, me he animado a hacerlo yo y espero que os resulte de ayuda para vuestras consultas.
Modo de empleo: wget [OPCIÓN]… [URL]…
Los argumentos obligatorios para las opciones largas son también obligatorios para las opciones cortas. Estos parámetros se encuentran indicados en mayúsculas para que los puedas identificar y sustituir rápidamente.
Inicio:
-V
, --version
| Muestra la versión de Wget y sale.-h
, --help
| Muestra esta ayuda.-b
, --background
| Ir a segundo plano después de empezar.-e
, --execute=COMANDO
| Ejecuta una orden estilo ‘.wgetrc’.
Ficheros de registro y de entrada:
-o
, --output-file=ARCHIVO
| Registrar mensajes en ARCHIVO.-a
, --append-output=ARCHIVO
| Anexar mensajes a ARCHIVO.-d
, --debug
| Saca montones de información para depuración.-q
, --quiet
| Silencioso (sin texto de salida).-v
, --verbose
| Sé verboso (es el método por defecto).-nv
, --no-verbose
| Desactiva modo verboso, sin ser silencioso.--report-speed=TIPO
| Ancho de banda de salida como TIPO. TIPO pueden ser bits.-i
, --input-file=ARCHIVO
| Descarga URLs encontradas en fichero (ARCHIVO) local o externo.-F
, --force-html
| Trata el fichero de entrada como HTML.-B
, --base=URL
| Resuelve enlaces HTML del fichero-de-entrada (-i -F) relativos a la URL.--config=ARCHIVO
| Especifica el archivo de configuración que se utilizará.
Descarga:
-t
, --tries=NÚMERO
| Define número de intentos a NÚMERO (0 es sin limite).--retry-connrefused
| Reintentar incluso si la conexión es rechazada.-O
, --output-document=ARCHIVO
| Escriba documentos al fichero ARCHIVO.-nc
, --no-clobber
| SOmita las descargas que se descargarían en archivos existentes (sobrescribiéndolos).-c
, --continue
| Continuar una descarga parcial de un fichero.--progress=TIPO
| Selecciona tipo de indicador de progreso.-N
, --timestamping
| No re-recuperar ficheros a menos que sean más nuevos que la versión local.--no-use-server-timestamps
| No poner la hora/fecha del fichero local a la que tenga el del servidor.-S
, --server-response
| Mostrar la respuesta del servidor.--spider
| (araña) no descargar nada.-T
, --timeout=SEGUNDOS
| Poner todos los valores de temporización a SEGUNDOS.--dns-timeout=SEGS
| Definir la temporización de la búsqueda DNS a SEGS.--connect-timeout=SEGS
| Definir la temporización de conexión a SEGS.--read-timeout=SEGS
| Definir la temporización de lectura a SEGS.-w
, --wait=SEGUNDOS
| Espera tantos SEGUNDOS entre reintentos.--waitretry=SEGUNDOS
| Espera 1..SEGUNDOS entre reintentos de una descarga.--random-wait
| Espera entre 0.5*WAIT…1.5*WAIT segs. entre descargas.--no-proxy
| Explícitamente desconecta el proxy.-Q
, --quota=NÚMERO
| Define la cuota de descarga a NÚMERO.--bind-address=DIRECCIÓN
| Bind a DIRECCIÓN (nombredeequipo o IP) en equipo local.--limit-rate=VELOCIDAD
| Limita velocidad de descarga a VELOCIDAD.--no-dns-cache
| Desactiva búsquedas en tampón DNS.--restrict-file-names=OS
| Restringe caracteres en nombres de ficheros a los que el SO permita.--ignore-case
| Ignorar mayús/minúsculas al encajar ficheros/directorios.-4
, --inet4-only
| Conectar sólo a direcciones IPv4.-6
, --inet6-only
| Conectar sólo a direcciones IPv6.--prefer-family=FAMILY
| Conectar primero a direcciones de la familia especificada, bien IPv6, IPv4, o ninguna.--user=USUARIO
| Poner el usuario de ambos ftp y http a USUARIO.--password=CONTRASEÑA
| Poner la contraseña de ambos ftp y http a CONTRASEÑA.--ask-password
| Pedir las contraseñas.--no-iri
| Desactivar soporte IRI.--local-encoding=ENC
| Usar codificación ENC como la codificación local para IRIs.--remote-encoding=ENC
| Usar ENC como la codificación remota por defecto.--unlink
| Remove file before clobber.
Directorios:
-nd
, --no-directories
| No crear directorios.-x
, --force-directories
| Forzar la creación de directorios.-nH
, --no-host-directories
| No crear directorios del anfitrión.--protocol-directories
| Use nombre de protocolo en los directorios.-P
, --directory-prefix=PREFIX
| Grabar los ficheros en PREFIX/…--cut-dirs=NÚMERO
| Ignorar NÚMERO de componentes de directorio remoto.
Opciones HTTP:
--http-user=USUARIO
| Poner el usuario http a USUARIO.--http-password=PASS
| Poner la contraseña http a PASS.--no-cache
| No permitir los datos en tampón del servidor.--default-page=NAME
| Cambiar el nombre de página por defecto (suele ser ‘index.html’.).-E
, --adjust-extension
| Grabe documentos HTML/CSS con las extensiones correctas.--ignore-length
| Ignorar campo ‘Content-Length’ en cabeceras .--header=STRING
| Insertar STRING entre las cabeceras.--max-redirect
| Máximo de redirecciones permitidas por página.--proxy-user=USUARIO
| poner USUARIO como nombre de usuario del proxy.--proxy-password=PASS
| Poner PASS como contraseña del proxy.--referer=URL
| Incluir cabecera ‘Referer: URL’ en petición HTTP.--save-headers
| Grabar las cabeceras HTTP a fichero.-U
, --user-agent=AGENTE
| Identificarse como AGENTE en vez de Wget/VERSIÓN.--no-http-keep-alive
| Desactivar HTTP keep-alive (conexiones persistentes).--no-cookies
| No usar «cookies».--load-cookies=FICHERO
| Cargar las «cookies» desde FICHERO antes de la sesión.--save-cookies=FICHERO
| Grabar las «cookies» a FICHERO después de la sesión.--keep-session-cookies
| Cargar y grabar las «cookies» de sesión (no-permanentes).--post-data=STRING
| Usar el método POST; enviar STRING como los datos.--post-file=FICHERO
| Usar el método POST; envía el contenido de FICHERO.--content-disposition
| Cumplir con la cabecera Content-Disposition cuando se elige nombre de ficheros locales (EXPERIMENTAL).--content-on-error
| Output the received content on server errors.--auth-no-challenge
| Enviar información de autenticicación básica HTTP sin antes esperar al desafío del servidor.
Opciones HTTPS (SSL/TLS):
--secure-protocol=PR
| Elija un protocolo seguro, uno de auto, SSLv2, SSLv3, TLSv1, TLSv1_1 y TLSv1_2.--no-check-certificate
| No validar el certificado del servidor.--certificate=FILE
| Fichero de certificado del cliente.--certificate-type=TYPE
| Fipo de certificado de cliente, PEM o DER.--private-key=FILE
| Fichero de llave privada.--private-key-type=TYPE
| Tipo de llave privada, PEM o DER.--ca-certificate=FILE
| Fichero con la agrupación de CAs.--ca-directory=DIR
| Directorio donde se guarda la lista «hash» de CAs.--random-file=FILE
| Fichero con datos aleatorios como semilla de SSL PRNG.--egd-file=FICHERO
| Fichero que denomina el conector EGD con datos aleatorios.
Opciones FTP:
--ftp-user=USUARIO
| Poner USUARIO como el usuario de ftp.--ftp-password=PASS
| Poner PASS como contraseña ftp.--no-remove-listing
| No eliminar los ficheros ‘.listing’.--no-glob
| Desactivar con Wget la generación de nombres de fichero del FTP (globbing).--no-passive-ftp
| Desactivar el modo «pasivo» de transferencia.--preserve-permissions
| Preservar permisos de archivos remotos.--retr-symlinks
| En modo recursivo, bajar los ficheros enlazados (no los directorios).
Opciones WARC:
--warc-file=FILENAME
| Save request/response data to a .warc.gz file.--warc-header=STRING
| Insert STRING into the warcinfo record.--warc-max-size=NUMBER
| Set maximum size of WARC files to NUMBER.--warc-cdx
| write CDX index files.--warc-dedup=FILENAME
| do not store records listed in this CDX file.--no-warc-compression
| do not compress WARC files with GZIP.--no-warc-digests
| do not calculate SHA1 digests.--no-warc-keep-log
| do not store the log file in a WARC record.--warc-tempdir=DIRECTORY
| location for temporary files created by the WARC writer.
Bajada recursiva:
-r
, --recursive
| Especificar descarga recursiva.-l
, --level=NUMBER
| Máxima profundidad de recursión (inf o 0 para infinita).--delete-after
| Borrar los ficheros localmente después de descargarlos.-k
, --convert-links
| Hacer que los enlaces en el HTML o CSS descargado apunte a ficheros locales.--backups=N
| Before writing file X, rotate up to N backup files.-K
, --backup-converted
| Antes de convertir el fichero X, salvaguardarlo como X.orig.-m
, --mirror
| Atajo para -N -r -l inf –no-remove-listing en Wget.-p
, --page-requisites
| Bajar todas las imágenes, etc. que se necesitan para mostrar la página HTML.--strict-comments
| Activar manejo stricto (SGML) de los comentarios en HTML.
Aceptar/rechazar recursivamente:
-A
, --accept=LIST
| Lista separada por comas de extensiones aceptadas.-R
, --reject=LIST
| Lista separada por comas de extensiones rechazadas.--accept-regex=REGEX
| regex matching accepted URLs.--reject-regex=REGEX
| regex matching rejected URLs.--regex-type=TYPE
| regex type (posix|pcre).-D
, --domains=LIST
| Lista separada por comas de dominios aceptados.--exclude-domains=LIST
| Lista separada por comas de dominios rechazados.--follow-ftp
| Seguir los enlaces a FTP de los documentos HTML.--follow-tags=LIST
| Lista separada por comas de etiquetas HTML a seguir.--ignore-tags=LIST
| Lista separada por comas de etiquetas HTML a ignorar.-H
, --span-hosts
| Ir a equipos extraños en el recorrido recursivo.-L
, --relative
| Sólo seguir enlaces relativos.-I
, --include-directories=LIST
| Lista de directorios permitidos.--trust-server-names
| Utiliza el nombre especificado por el último componente de la URL de redirección.-X
, --exclude-directories=LIST
| Lista de directorios excluidos.-np
, --no-parent
| No ascender al directorio padre.
Si quieres ampliar información, puedes consultar el manual de GNU Wget.
Deja una respuesta