Crawler est un outil de veille automatique.


Périodiquement, il surveille une liste de sites web.
Cet outil récupère le contenu sur ces sites afin de nourrir un moteur de recherche. Grâce à une vérification intelligente, il ne recueille que les modifications significatives



Les données récupérées sont transmises au moteur de recherche en "langage naturel" (descriptif).
Avant de le transférer, Crawler transforme le contenu en texte brut (sans mise en page), quelque soit le format des fichiers (TXT, WORD, HTML, EXCEL, PDF).
Pour répondre aux besoins du client, Crawler surveille au moins 2.000 sites, classés en différentes familles (douanes, fiscalité, ...).




Points clés de notre approche méthodologique :
  • Analyse des besoins matériels
  • Collaboration avec le prestataire du client
  • Réalisation d'une interface de contrôle et de surveillance simple d'emploi
  • Surveillance de l'outil durant le premier crawling

  • Comme avantages supplémentaires, cet outil possède :
  • Une contrôleur de bande passante
  • Une automatisation des tâches
  • Une intelligence dans son exécution