Cómo descargar un sitio web completo para leer sin conexión
Aunque el Wi-Fi está disponible en todas partes en estos días, es posible que se encuentre sin él de vez en cuando. Y cuando lo haga, es posible que haya sitios web que desearía haber guardado para poder acceder a ellos sin conexión, tal vez para investigación, entretenimiento o simplemente para la posteridad.
Es bastante básico guardar páginas web individuales para leerlas sin conexión, pero ¿qué sucede si desea descargar un sitio web completo? No se preocupe, es más fácil de lo que piensa. Pero no confíe en nuestra palabra. Aquí hay varias herramientas ingeniosas que puede usar para descargar cualquier sitio web y leerlo sin conexión, sin problemas.
1. WebCopy
WebCopy de Cyotek toma la URL de un sitio web y la analiza en busca de enlaces, páginas y medios. A medida que encuentra páginas, busca de forma recursiva más enlaces, páginas y medios hasta que descubre todo el sitio web. Luego, puede usar las opciones de configuración para decidir qué partes descargar sin conexión.
Lo interesante de WebCopy es que puede configurar varios proyectos, cada uno de los cuales tiene su propia configuración y configuración. Esto hace que sea fácil volver a descargar muchos sitios cuando lo desee, cada uno de la misma manera cada vez.
Un proyecto puede copiar muchos sitios web, así que utilícelos con un plan organizado (por ejemplo, un proyecto "tecnológico" para copiar sitios de tecnología).
Cómo descargar un sitio web completo con WebCopy
- Instale y ejecute la aplicación.
- Navegue a Archivo> Nuevo para crear un nuevo proyecto.
- Escriba la URL en el campo Sitio web .
- Cambie el campo Guardar carpeta al lugar donde desea que se guarde el sitio.
- Juegue con Proyecto> Reglas… ( obtenga más información sobre las Reglas de WebCopy ).
- Navegue a Archivo> Guardar como… para guardar el proyecto.
- Haga clic en Copiar en la barra de herramientas para iniciar el proceso.
Una vez que se realiza la copia, puede usar la pestaña Resultados para ver el estado de cada página individual y / o archivo multimedia. La pestaña Errores muestra los problemas que pueden haber ocurrido y la pestaña Omitidos muestra los archivos que no se descargaron.
Pero lo más importante es el mapa del sitio , que muestra la estructura de directorios completa del sitio web tal como lo descubrió WebCopy.
Para ver el sitio web sin conexión, abra el Explorador de archivos y navegue hasta la carpeta de guardado que designó. Abra index.html (o, a veces, index.htm ) en el navegador de su elección para comenzar a navegar.
Descargar: WebCopy paraWindows (gratis)
2. HTTrack
HTTrack es más conocido que WebCopy y posiblemente sea mejor porque es de código abierto y está disponible en plataformas distintas de Windows. La interfaz es un poco torpe y deja mucho que desear, sin embargo, funciona bien, así que no dejes que eso te desanime.
Al igual que WebCopy, utiliza un enfoque basado en proyectos que le permite copiar varios sitios web y mantenerlos todos organizados. Puede pausar y reanudar las descargas, y puede actualizar los sitios web copiados volviendo a descargar archivos nuevos y antiguos.
Cómo descargar un sitio web completo con HTTrack
- Instale y ejecute la aplicación.
- Haga clic en Siguiente para comenzar a crear un nuevo proyecto.
- Dé al proyecto un nombre, categoría, ruta base, luego haga clic en Siguiente .
- Seleccione Descargar sitio (s) web para Acción, luego escriba la URL de cada sitio web en el cuadro Direcciones web , una URL por línea. También puede almacenar URL en un archivo TXT e importarlo, lo cual es conveniente cuando desea volver a descargar los mismos sitios más adelante. Haga clic en Siguiente .
- Ajuste los parámetros si lo desea, luego haga clic en Finalizar .
Una vez que todo está descargado, puede navegar por el sitio como de costumbre yendo al lugar donde se descargaron los archivos y abriendo index.html o index.htm en un navegador.
Cómo utilizar HTTrack con Linux
Si es un usuario de Ubuntu, así es como puede usar HTTrack para guardar un sitio web completo:
- Inicie la Terminal y escriba el siguiente comando:
sudo apt-get install httrack
- Le pedirá su contraseña de Ubuntu (si ha establecido una). Escríbalo y presione Enter . La Terminal descargará la herramienta en unos minutos.
- Finalmente, escriba este comando y presione Enter . Para este ejemplo, descargamos el sitio web popular, Brain Pickings .
httrack https://www.brainpickings.org/
- Esto descargará todo el sitio web para leerlo sin conexión.
Puede reemplazar la URL del sitio web aquí con la URL del sitio web que desee descargar. Por ejemplo, si desea descargar la Enciclopedia Británica completa, tendrá que ajustar su comando a esto:
httrack https://www.britannica.com/
Descargar: HTTrack para Windows y Linux | Android (gratis)
3.SiteSucker
Si está en una Mac, su mejor opción es SiteSucker . Esta sencilla herramienta copia sitios web completos, mantiene la misma estructura y también incluye todos los archivos multimedia relevantes (por ejemplo, imágenes, PDF, hojas de estilo).
Tiene una interfaz limpia y fácil de usar: literalmente pegas la URL del sitio web y presionas Enter .
Una característica ingeniosa es la capacidad de guardar la descarga en un archivo y luego usar ese archivo para descargar los mismos archivos y estructura nuevamente en el futuro (o en otra máquina). Esta característica también es lo que permite a SiteSucker pausar y reanudar las descargas.
SiteSucker cuesta alrededor de $ 5 y no viene con una versión gratuita o una prueba gratuita, que es su mayor desventaja. La última versión requiere macOS 11 Big Sur o superior. Hay versiones antiguas de SiteSucker disponibles para sistemas Mac más antiguos, pero es posible que falten algunas funciones.
Descargar : SiteSucker para iOS | Mac ($ 4,99)
4. Wget
Wget es una utilidad de línea de comandos que puede recuperar todo tipo de archivos a través de los protocolos HTTP y FTP. Dado que los sitios web se sirven a través de HTTP y la mayoría de los archivos multimedia web son accesibles a través de HTTP o FTP, Wget es una excelente herramienta para descargar sitios web completos.
Wget viene incluido con la mayoría de los sistemas basados en Unix. Si bien Wget se usa generalmente para descargar archivos individuales, también se puede usar para descargar de forma recursiva todas las páginas y archivos que se encuentran a través de una página inicial:
wget -r -p https://www.makeuseof.com
Dependiendo del tamaño, puede llevar un tiempo descargar el sitio web completo.
Sin embargo, algunos sitios pueden detectar y prevenir lo que estás intentando hacer porque copiar un sitio web puede costarles mucho ancho de banda. Para evitar esto, puede disfrazarse como un navegador web con una cadena de agente de usuario:
wget -r -p -U Mozilla https://www.thegeekstuff.com
Si quieres ser educado, también debes limitar la velocidad de descarga (para no acaparar el ancho de banda del servidor web) y hacer una pausa entre cada descarga (para no abrumar al servidor web con demasiadas solicitudes):
wget -r -p -U Mozilla --wait=10 --limit-rate=35K https://www.thegeekstuff.com
Cómo usar Wget en una Mac
En una Mac, puede instalar Wget usando un solo comando de Homebrew: brew install wget .
- Si aún no tiene Homebrew instalado, descárguelo con este comando:
/usr/bin/ruby -e "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)"
- A continuación, instale Wget con este comando:
brew install wget
- Una vez finalizada la instalación de Wget, puede descargar el sitio web con este comando:
wget path/to/local.copy http://www.brainpickings.org/
En Windows, necesitará usar esta versión portada en su lugar. Descargue e instale la aplicación y siga las instrucciones para completar la descarga del sitio.
Descargue fácilmente sitios web completos
Ahora que sabe cómo descargar un sitio web completo, nunca debería quedarse sin algo para leer, incluso cuando no tenga acceso a Internet. Pero recuerde: cuanto más grande sea el sitio, mayor será la descarga. No recomendamos descargar sitios masivos como MUO porque necesitará miles de MB para almacenar todos los archivos multimedia que usamos.