Crawler est un outil de veille automatique.
Périodiquement, il surveille une liste de sites web.
Cet outil récupère le contenu sur ces sites afin de nourrir un moteur de recherche.
Grâce à une vérification intelligente, il ne recueille que les modifications significatives
Les données récupérées sont transmises au moteur de recherche en
"langage naturel" (descriptif).
Avant de le transférer, Crawler transforme le contenu en texte brut (sans mise en page), quelque soit le format des fichiers
(TXT, WORD, HTML, EXCEL, PDF).
Pour répondre aux besoins du client, Crawler surveille au moins 2.000 sites,
classés en différentes familles (douanes, fiscalité, ...).
Points clés de notre approche méthodologique :
Analyse des besoins matériels
Collaboration avec le prestataire du client
Réalisation d'une interface de contrôle et de surveillance simple d'emploi
Surveillance de l'outil durant le premier crawling
Comme avantages supplémentaires, cet outil possède :
Une contrôleur de bande passante
Une automatisation des tâches
Une intelligence dans son exécution