Intermedic: Revista de Internet e Medicina
Contents Busca Indice Email In English Anterior Proximo

Software

Web Wacker


O que é | Como funcionaA base de dados | Avaliação |


WebWhacker 2.0, um software desenvolvido pela ForeFront Group, Inc., permite a realização de cópias (download) integrais de sites da WWW, incluindo imagens, textos (HTML), etc., que façam parte da mesma, armazenando-os no disco rígido. Posteriormente, usando um visualizador qualquer (Netscape, Internet Explorer, etc.), é possível navegar pelos sites armazenados, sem ter necessidade de se conectar à Internet.

 O sistema funciona como se você fizesse uma assinatura do site. Primeiramente, o endereço-base do site (chamado de URL ou Uniform Resource Locator), é armazenado em uma lista de sites assinados. Depois de descarregar o site pela primeira vez, cada "renovação" do site copia apenas as imagens e textos que mudaram desde a última vez.

 O WebWacker tem muitas aplicações interessantes, entre as quais:

 Outra característica interessante do WebWacker 2.0 é funcionar como um "proxy", ou representante. Este é um computador especial, que geralmente fica no seu provedor de acesso à Internet, e que armazena todas as páginas e imagens que foram acessadas pelos seus usuários. Deste modo, se alguma outra pessoa (ou você mesmo) for acessar novamente os mesmos arquivos, o proxy fornece diretamente para você, sem necessidade de estabelecer conexão com o servidor original daquele material. Isso aumenta muito a velocidade de acesso às páginas mais acessadas. Com o WebWacker, ele gerencia de forma transparente o seu acesso, redirecionando o Netscape ou Internet Explorer para o disco local ou para o servidor remoto, conforme a necessidade.

 O programa permite ao usuário adicionar endereços de sites interessantes aos queira "assinar". Existem duas maneiras de fazer isso. A primeira é digitar o endereço completo no modo Add (adicionar), se você o conhece. A segunda é "agarrar" (Grab) o endereço enquanto você estiver navegando na Internet.  A atualização de um site capturado pelo WebWacker pode ser programada, especificando-se datas e horários para o acesso, em base diária, semanal ou mensal. Apenas os arquivos mudados são copiados.

O WebWacker 2.0 é um shareware, que pode ser copiado gratuitamente a partir do site da empresa Forefront Group (http://www.ffg.com) ou de sites contendo shareware para Internet, como o Tucows (http://www.tucows.com) ou Shareware.com (http://www.shareware.com).


ComoFunciona

"Wacking" significa "ceifar" em inglês, e isso é ilustrado por um facão de mato, no canto superior direito do programa WebWhacker. Para copiar-se um site pela primeira vez, coloca-se o seu endereço na lista do WebWacker, usando os comandos Add ou Grab. Em seguida, clica-se no botão com o ícone do facão, para iniciar a cópia, ou  "wacking". Para isso, evidentemente, você deve estar conectado à Internet através de uma conexão SLIP ou PPP (a mesma para o qual se usa o Netscape, o Eudora, etc.). O programa pergunta qual é o nível de cópia que se deseja, e se a cópia deve ser limitada apenas ao site. O nível da cópia (1, 2, 3, etc.) diz para o WebWacker, quantos links ele deve perseguir, desde a página original, além do qual as páginas não serão copiadas. Se você instruir o WebWacker a ficar apenas no site, ele não perseguirá links com outros endereços, com domínios diferentes do que você está copiando. Se você não impuser esta restrição, o WebWacker entrará em outros sites externos e os copiará para seu disco (atenção, que isso pode levar à ocupação de um enorme espaço em disco, além de trazer coisas que não se deseja).

Ao se iniciar a cópia, a imagem do facão começa a fazer um movimento de corte, e no canto inferior direito aparece um painel, mostrando os arquivos que estão sendo copiados, seu tamanho, etc. Todos os arquivos relacionados são copiados, inclusive imagens, applets Java, video clipes, textos (HTML), etc. Cada link novo encontrado pelo WebWacker é cotejado com uma lista dos arquivos que já foram copiados. Se ele é mais novo, ou se ainda não foi copiado, ele é transferido. Nesse processo, é montada a base de dados.


A Base de Dados

 Ao se solicitar o descarregamento de um determinado site, o WebWacker monta uma base de dados interna, que contém toda a informação sobre a estrutura do site, tais como os arquivos, seus nomes e datas; os diretórios e subdiretórios, as vinculações (links) entre as páginas, etc. O usuário pode visualizar essa base de duas maneiras:

As propriedades de cada arquivo também podem ser visualizadas (por exemplo, data e hora da última atualização, tipo de arquivo, endereço URL completo, etc.

Clicando-se duas vezes sobre o nome do arquivo que se quer visualizar, o Netscape ou outro "browser" que esteja instalado em seu computador, é chamado e o arquivo é carregado. Todos os arquivos descarregados ficam dentro de um único arquivo, com a extensão wwdb. Se você quiser tirar as páginas HTML, arquivos de imagem, etc., de dentro dessa base de dados, e gravar em um diretório qualquer, o programa tem uma função chamada Export.

Um programa utilitário integrante do WebWacker 2.0, chamado WebManager, permite realizar muitas outras funções, tais como uma categorização dos sites copiados (Negócios, Educação, Revistas, etc.) ou por subdivisões específicas, que o próprio usuário pode criar. É possível também realizar-se buscas de textos específicos, usando lógica do tipo E/OU/NÃO, etc.


Avaliação

O programa é muito fácil de copiar e instalar, e ocupa pouco menos de 2 Mbytes no disco. Sua utilização, entretanto, não é muito intuitiva. Recomenda-se ler o Help do programa antes, principalmente o ítem relativo a como adicionar URLs e como copiar. Os demais módulos do programa são mais fáceis de entender sem precisar ler o manual.

A velocidade de descarregamento é típica da de um programa FTP, e vai depender, é claro, da velocidade da conexào e outros fatores que, da mesma forma que para um FTP, podem tornar mais rápido ou mais lento o acesso. Em um teste realizado em condições boas (velocidades médias de 2 Kbps), um site inteiro, com cerca de 3 Mbytes de material, cerca de 150 HTMLs e 162 imagens, a cópia foi feita em pouco menos de meia hora. A vantagem é que toda vez que se for fazer uma atualização, o WebWacker copiará apenas os arquivos mudados ou novos.

O programa tem alguns problemas, no entanto:

Caso o leitor se interesse, existem outros programas que competem com o WebWacker, tais como:

Renato M.E. Sabbatini


Contents Busca Indice Email In English Anterior Proximo

Publicação:
Nucleo de Informatica Biomedica UNICAMP
Núcleo de Informática Biomédica
Universidade Estadual de Campinas

© 1997 Renato M.E. Sabbatini
Apoio: