Qué es Wget: comando, opciones y parámetros
Wget es una herramienta utilizada a traves de línea de comandos que permite descargar archivos mediante los protocolos web más utilizados (HTTP, HTTPS, FTP y FTPS). Se usa principalmente en sistemas derivados de UNIX y lo habitual es manejarla cuando trabajamos con servidores, ya que nos facilita tratar con archivos de un modo cómodo directamente desde la consola, desde nuestros scripts o programando tareas cron en el backend de nuestro proveedor de hosting.
Lo que vamos a ver a continuación es el listado completo de opciones y parámetros que podemos usar con el comando wget
. Este listado lo he extraído de la ayuda que ofrece el propio Wget y que me resulta de especial interés como tabla de consulta cuando estoy trabajando. Como extrañamente no lo he encontrado subido a internet tal cual, me he animado a hacerlo yo y espero que os resulte de ayuda para vuestras consultas.
Modo de empleo: wget [OPCIÓN]… [URL]…
Los argumentos obligatorios para las opciones largas son también obligatorios para las opciones cortas. Estos parámetros se encuentran indicados en mayúsculas para que los puedas identificar y sustituir rápidamente.
Inicio:
-V
, --version
| Muestra la versión de Wget y sale.
-h
, --help
| Muestra esta ayuda.
-b
, --background
| Ir a segundo plano después de empezar.
-e
, --execute=COMANDO
| Ejecuta una orden estilo ‘.wgetrc’.
Ficheros de registro y de entrada:
-o
, --output-file=ARCHIVO
| Registrar mensajes en ARCHIVO.
-a
, --append-output=ARCHIVO
| Anexar mensajes a ARCHIVO.
-d
, --debug
| Saca montones de información para depuración.
-q
, --quiet
| Silencioso (sin texto de salida).
-v
, --verbose
| Sé verboso (es el método por defecto).
-nv
, --no-verbose
| Desactiva modo verboso, sin ser silencioso.
--report-speed=TIPO
| Ancho de banda de salida como TIPO. TIPO pueden ser bits.
-i
, --input-file=ARCHIVO
| Descarga URLs encontradas en fichero (ARCHIVO) local o externo.
-F
, --force-html
| Trata el fichero de entrada como HTML.
-B
, --base=URL
| Resuelve enlaces HTML del fichero-de-entrada (-i -F) relativos a la URL.
--config=ARCHIVO
| Especifica el archivo de configuración que se utilizará.
Descarga:
-t
, --tries=NÚMERO
| Define número de intentos a NÚMERO (0 es sin limite).
--retry-connrefused
| Reintentar incluso si la conexión es rechazada.
-O
, --output-document=ARCHIVO
| Escriba documentos al fichero ARCHIVO.
-nc
, --no-clobber
| SOmita las descargas que se descargarían en archivos existentes (sobrescribiéndolos).
-c
, --continue
| Continuar una descarga parcial de un fichero.
--progress=TIPO
| Selecciona tipo de indicador de progreso.
-N
, --timestamping
| No re-recuperar ficheros a menos que sean más nuevos que la versión local.
--no-use-server-timestamps
| No poner la hora/fecha del fichero local a la que tenga el del servidor.
-S
, --server-response
| Mostrar la respuesta del servidor.
--spider
| (araña) no descargar nada.
-T
, --timeout=SEGUNDOS
| Poner todos los valores de temporización a SEGUNDOS.
--dns-timeout=SEGS
| Definir la temporización de la búsqueda DNS a SEGS.
--connect-timeout=SEGS
| Definir la temporización de conexión a SEGS.
--read-timeout=SEGS
| Definir la temporización de lectura a SEGS.
-w
, --wait=SEGUNDOS
| Espera tantos SEGUNDOS entre reintentos.
--waitretry=SEGUNDOS
| Espera 1..SEGUNDOS entre reintentos de una descarga.
--random-wait
| Espera entre 0.5*WAIT…1.5*WAIT segs. entre descargas.
--no-proxy
| Explícitamente desconecta el proxy.
-Q
, --quota=NÚMERO
| Define la cuota de descarga a NÚMERO.
--bind-address=DIRECCIÓN
| Bind a DIRECCIÓN (nombredeequipo o IP) en equipo local.
--limit-rate=VELOCIDAD
| Limita velocidad de descarga a VELOCIDAD.
--no-dns-cache
| Desactiva búsquedas en tampón DNS.
--restrict-file-names=OS
| Restringe caracteres en nombres de ficheros a los que el SO permita.
--ignore-case
| Ignorar mayús/minúsculas al encajar ficheros/directorios.
-4
, --inet4-only
| Conectar sólo a direcciones IPv4.
-6
, --inet6-only
| Conectar sólo a direcciones IPv6.
--prefer-family=FAMILY
| Conectar primero a direcciones de la familia especificada, bien IPv6, IPv4, o ninguna.
--user=USUARIO
| Poner el usuario de ambos ftp y http a USUARIO.
--password=CONTRASEÑA
| Poner la contraseña de ambos ftp y http a CONTRASEÑA.
--ask-password
| Pedir las contraseñas.
--no-iri
| Desactivar soporte IRI.
--local-encoding=ENC
| Usar ccodificación ENC como la codificación local para IRIs.
--remote-encoding=ENC
| Usar ENC como la codificación remota por defecto.
--unlink
| Remove file before clobber.
Directorios:
-nd
, --no-directories
| No crear directorios.
-x
, --force-directories
| Forzar la creación de directorios.
-nH
, --no-host-directories
| No crear directorios del anfitrión.
--protocol-directories
| Use nombre de protocolo en los directorios.
-P
, --directory-prefix=PREFIX
| Grabar los ficheros en PREFIX/…
--cut-dirs=NÚMERO
| Ignorar NÚMERO de componentes de directorio remoto.
Opciones HTTP:
--http-user=USUARIO
| Poner el usuario http a USUARIO.
--http-password=PASS
| Poner la contraseña http a PASS.
--no-cache
| No permitir los datos en tampón del servidor.
--default-page=NAME
| Cambiar el nombre de página por defecto (suele ser ‘index.html’.).
-E
, --adjust-extension
| Grabe documentos HTML/CSS con las extensiones correctas.
--ignore-length
| Ignorar campo ‘Content-Length’ en cabeceras .
--header=STRING
| Insertar STRING entre las cabeceras.
--max-redirect
| Máximo de redirecciones permitidas por página.
--proxy-user=USUARIO
| poner USUARIO como nombre de usuario del proxy.
--proxy-password=PASS
| Poner PASS como contraseña del proxy.
--referer=URL
| Incluir cabecera `Referer: URL’ en petición HTTP.
--save-headers
| Grabar las cabeceras HTTP a fichero.
-U
, --user-agent=AGENTE
| Identificarse como AGENTE en vez de Wget/VERSIÓN.
--no-http-keep-alive
| Desactivar HTTP keep-alive (conexiones persistentes).
--no-cookies
| No usar «cookies».
--load-cookies=FICHERO
| Cargar las «cookies» desde FICHERO antes de la sesión.
--save-cookies=FICHERO
| Grabar las «cookies» a FICHERO después de la sesión.
--keep-session-cookies
| Cargar y grabar las «cookies» de sesión (no-permanentes).
--post-data=STRING
| Usar el método POST; enviar STRING como los datos.
--post-file=FICHERO
| Usar el método POST; envía el contenido de FICHERO.
--content-disposition
| Cumplir con la cabecera Content-Disposition cuando se elige nombre de ficheros locales (EXPERIMENTAL).
--content-on-error
| Output the received content on server errors.
--auth-no-challenge
| Enviar información de autenticicación básica HTTP sin antes esperar al desafío del servidor.
Opciones HTTPS (SSL/TLS):
--secure-protocol=PR
| Elija un protocolo seguro, uno de auto, SSLv2, SSLv3, TLSv1, TLSv1_1 y TLSv1_2.
--no-check-certificate
| No validar el certificado del servidor.
--certificate=FILE
| Fichero de certificado del cliente.
--certificate-type=TYPE
| Fipo de certificado de cliente, PEM o DER.
--private-key=FILE
| Fichero de llave privada.
--private-key-type=TYPE
| Tipo de llave privada, PEM o DER.
--ca-certificate=FILE
| Fichero con la agrupación de CAs.
--ca-directory=DIR
| Directorio donde se guarda la lista «hash» de CAs.
--random-file=FILE
| Fichero con datos aleatorios como semilla de SSL PRNG.
--egd-file=FICHERO
| Fichero que denomina el conector EGD con datos aleatorios.
Opciones FTP:
--ftp-user=USUARIO
| Poner USUARIO como el usuario de ftp.
--ftp-password=PASS
| Poner PASS como contraseña ftp.
--no-remove-listing
| No eliminar los ficheros ‘.listing’.
--no-glob
| Desactivar generación de nombres de fichero del FTP (globbing).
--no-passive-ftp
| Desactivar el modo «pasivo» de transferencia.
--preserve-permissions
| Preserve remote file permissions.
--retr-symlinks
| En modo recursivo, bajar los ficheros enlazados (no los directorios).
Opciones WARC:
--warc-file=FILENAME
| Save request/response data to a .warc.gz file.
--warc-header=STRING
| Insert STRING into the warcinfo record.
--warc-max-size=NUMBER
| Set maximum size of WARC files to NUMBER.
--warc-cdx
| write CDX index files.
--warc-dedup=FILENAME
| do not store records listed in this CDX file.
--no-warc-compression
| do not compress WARC files with GZIP.
--no-warc-digests
| do not calculate SHA1 digests.
--no-warc-keep-log
| do not store the log file in a WARC record.
--warc-tempdir=DIRECTORY
| location for temporary files created by the WARC writer.
Bajada recursiva:
-r
, --recursive
| Especificar descarga recursiva.
-l
, --level=NUMBER
| Máxima profundidad de recursión (inf o 0 para infinita).
--delete-after
| Borrar los ficheros localmente después de descargarlos.
-k
, --convert-links
| Hacer que los enlaces en el HTML o CSS descargado apunte a ficheros locales.
--backups=N
| Before writing file X, rotate up to N backup files.
-K
, --backup-converted
| Antes de convertir el fichero X, salvaguardarlo como X.orig.
-m
, --mirror
| Atajo para -N -r -l inf –no-remove-listing.
-p
, --page-requisites
| Bajar todas las imágenes, etc. que se necesitan para mostrar la página HTML.
--strict-comments
| Activar manejo stricto (SGML) de los comentarios en HTML.
Aceptar/rechazar recursivamente:
-A
, --accept=LIST
| Lista separada por comas de extensiones aceptadas.
-R
, --reject=LIST
| Lista separada por comas de extensiones rechazadas.
--accept-regex=REGEX
| regex matching accepted URLs.
--reject-regex=REGEX
| regex matching rejected URLs.
--regex-type=TYPE
| regex type (posix|pcre).
-D
, --domains=LIST
| Lista separada por comas de dominios aceptados.
--exclude-domains=LIST
| Lista separada por comas de dominios rechazados.
--follow-ftp
| Seguir los enlaces a FTP de los documentos HTML.
--follow-tags=LIST
| Lista separada por comas de etiquetas HTML a seguir.
--ignore-tags=LIST
| Lista separada por comas de etiquetas HTML a ignorar.
-H
, --span-hosts
| Ir a equipos extraños en el recorrido recursivo.
-L
, --relative
| Sólo seguir enlaces relativos.
-I
, --include-directories=LIST
| Lista de directorios permitidos.
--trust-server-names
| Utiliza el nombre especificado por el último componente de la URL de redirección.
-X
, --exclude-directories=LIST
| Lista de directorios excluidos.
-np
, --no-parent
| No ascender al directorio padre.
Si quieres ampliar información, puedes consultar el manual de GNU Wget.
Publicado por Jesús Tovar
Categorías: Programación, Recursos
Etiquetas: wget, glosario, comandos, servidores
Deja una respuesta