miércoles, 7 de diciembre de 2011

Tres formas de almacear de forma offline unha páxina ou sitio Web completo




Guardar Web como HTML

Pregunta <<"Bernos">>  a través do noso formulario de contacto (¡moitas grazas por plantexarnos a tua dubida!) si conocemos maneiras para poder almacear unha Web nun ordeador ou nun dispositivo portátil, para así poder consultarla sin necesidade de conexión a Internet.
A respuesta mais rotunda: Si, é posibel. a mais acertada: É posible e ademais non é moi complicado, en función do que busques. é posible almacear unha páxina (un artigo de Costa, por exemplo) ou almacear, directamente, un sitio Web completo, dende a raíz ás páxinas individuais. En concreto vou presentarvos tres formas de almacear páxinas Web para consultalas sen conexión a Internet.

A mais rápida e obvia: gardar os arquivos HTML

Si o que buscamos é almacear as páxinas Web (unha páxina, non un sitio Web completo) no noso ordeador, para revisalas e velas igual que si estuveramos conectados a Internet, estamos de sorte. Prácticamente todos os navegadores Web incluen esta opción de serie.
En Firefox 8 a opción está no botón de Firefox > Guardar como. En Safari e Chrome, clic na chave inclesa> Guardar como. En Internet Explorer 9, clic na chave inclesa, Arqiivo > Gardar como. En Opera deberemos pulsar no botón de Opera, Gardar como.
Este comando xerará ou un archivo HTML (a página en sí) xunto cun cartafol (cos arquivos auxiliares como as imáxes, algún script…), ou ben un arquivo MHTML con todo o contido gardado nél. Si é a primeira opción debemos ter coidado: conven mover á vez o cartafol e o arquivo (terán o mesmo nome) para evitar perder as referencias ás imáxes, por exemplo.
A principal desventalla desto é que non podemos navegar o site sin conexión a Internet: non se gardan as páxinas ás que enlaza a que gardamos. Pero temos duas opcions para gardar unha Web completa ou nada máis que alguns niveis de enlaces.

Gardando un site completo: wget e HTTrack

wget
Se queremos gardar un site completo, por outra parte, temos duas opcions, e as duas completamente gratuitas. A primeira está incluida por defecto en todas as distribucions de Linux (i é instalable en Windows), e a outra é multiplataforma. A principal diferenza para nos será a interfaz.
wget é unha ferramenta terriblemente potente para descargar da Web, e cun pouco de maxinación é posible utiliza-la para descargar tanto sites completos como páxinas individuais. Vemos un exemplo para o primeiro caso:
wget --recursive --level=50 -p http://www.costaweb.es
Ese comando o que fará é executar wget de forma recursiva (para descargar a páxina e todas as páxinas ás que enlaza), ata o nivel 10 de profundidade (é decir, ao que chegaríamos facendo clic nun máximo de 10 enlaces), gardando os arquivos auxiliares (para eso é o parámetro -p) e convirtindo os enlaces aos das descargas locais si se realizan (si non se manteñen as referenzas a arquivos remotos). Escribimos ese comando na terminal, esperamos e… xa está. Non se descargarán arquivos de dominios distintos por defecto.

Se queremos facer a copia de todo o sitio Web podemos poner inf como número de niveles a descargar, pero para evitar sobrecargar o servidor eu engadiría unha opción extra: --wait=30 fará que wget espere 30 segundos entre descarga e descarga. wget pode ser usado para moito máis, pero para o propósito deste artígo nos valerá con esos parámetros. Si tendés curiosidade, man wget será capaz de saciala, asegurovo-lo.(Instalade im translator en firefox posto que está en ingles, se non dominades o idioma)
Si non queres utilizar un comando de terminal, tes a vosa disposición HTTrack, unha aplicación que permite o mesmo, con moitísimas opcions de configuración e interfaz gráfica. É unha aplicación disponible para descargar desde a sua página Web e nos repositorios das principais distribucions de GNU/Linux.
Algunhas páxinas Web (como Costaweb, sin ir más lonxe, anque non estou certo de todo) non permiten o uso deste tipo de ferramentas sobre as suas páxinas Web. Deshabilitase no archivo robots.txt (dado que todas estas aplicacions identificanse como o que son). Debemos ser cuidadosos también coas opcions que marcamos, dado que este tipo de accions utilizan moito ancho de banda: tanto de baixada na nosa líña como de subida na do servidor, por non falar da carga de CPU en ambas máquinas.

Gardando artígos como PDF: Joliprint, impresoras PDF

Guardar como PDF en OS X

Si o que buscamos é almacear no noso PC un post como, por exemplo, este que estás lendo, tendes unha alternativa ainda mellor: gardalo como PDF. Así además permite imprimilo en papel, si todavía queda alguien que o faga. Esta forma é ideal si non necesitamos hiperenlaces (anque hai algún software que admite gardar sites completos en formato PDF).
En Genbeta os falamos fai tiempo de un bookmarklet chamado Joliprint que permite converter o contido dun post a PDF, incluso aplicando un estilo bastante elegante, que o fai idóneo para impresión. Ese bookmarklet segue activo, como podédes maxinar (de non ser así non o mencionaría no post).
Si querédes utilizar ferramentas almaceadas no voso PC (e non na nube) podédes non complicar-vos demasiado a vida e instalar unha impresora PDF. Dende a oficial de Adobe ata outras como doPDF hai todo un abanico de posibilidades, gratuitas, de pago, con publicidade, sen publicidade.
Eu persoalmente en Windows recomendo a que enlazo. En OS X xa se incluye una herramienta así, e nos distintos sabores de GNU/Linux  é tan simple como instalar o paquete cups-pdf co noso xestor de paquetes (si é que non está xa instalado). O funcionamento é idéntico nas tres plataformas: tan sóio é necesario usar a opción de imprimir no noso navegador, seleccionando esa impresora no diálogo que aparece.
Si querédes transferir estos artígos a un lector de libros electrónicos é mellor combinar duas opcions: gardar el archivo HTML no noso equipo e convertilo con Calibre. Desa forma usaráse o formato máis adecuado para cada dispositivo (O soporte de PDF nestos aparatos en ocasions deixa moito que desexar).
Como védes alternativas non faltan. Eu presentovos tres, pero estoy seguro de que con imaginación podemos conseguir algunhas más. Non o dubidédes e compartideas nos comentarios, seguro que o agradecemos todos.

No hay comentarios:

Publicar un comentario