Les outils de la recherche sur le Web

4. Les moteurs de recherche (MDR)

Le moteur de recherche (MDR) est une application web capable de chercher des informations sur la toile.  Chaque MDR possède des Robots qui se chargent de l’indexation des sites dans la base de donnée du MDR.

La capture d'écran suivante montre un exemple de table d'indexation d'un MDR. Pour chaque mot clé "possible", il ajoute tous les sites qu'à indexé le Robot!!!.

 La recherche d'informations sur un sujet donné se limitera une simple réponse à une requête envoyé de l'interface web du MDR vers sa base de donnée (Table d'indexation). un MDR  pourra alors afficher des millions de sites en une fraction de seconde!!!!!

 Il est important de retenir qu'un MDR a trois fonctions principales :

  • Exploration du Web à la recherche de nouvelles pages web.
  • Indexation des pages web trouvées.
  • Réponses aux requêtes soumises par les internautes.

Important : Seuls les sites ouvert à l'indexation seront visibles et indexés par les robots. C'est ce qu'on appel le Web visible (20 à 30% de la toile). Tous les autres sites (environ 70%) seront introuvables par une recherche via un MDR. c'est ce qu'on appel le web invisible ou Dark Web

Exemples :

Le MDR de Google est  sans doute l'un des meilleurs MDR sur le marché, cependant il utilise les données de navigation de ses clients pour les suivre sur Internet. Pour certains personnes, cette personnalisation peut devenir agaçante.

Il existe d'autres MDR qui ne suivent pas vos traces, on cite :

 

MDR, mode de recherche

La recherche se fait par mots clés

 

MDR, les avantages

  1. Recherches dans une grande masse d'informations proposées par des milliards de sites web;
  2. Obtention rapide d'informations précises sur des sujets divers et variés;
  3. Repérage et indexation des sites récents ou ayant été écartés des annuaires;
  4. Possibilité de faire des recherches complexes en utilisant des filtres;
  5. Possibilité de trouver des documents spécifiques.

MDR, les inconvénients

  1. des résultats non contrôlés, certains URL affichés dans les résultats sont périmées;
  2. des résultats parfois inadapté ou surprenants car l'indexation est automatique;
  3. des résultats peuvent être mal classés puisque les critères de tri dépendent du MDR;
  4. l'adaptation difficile de l'usager aux divers interfaces proposés par les MDR.
  5. aucun moteur de recherche ne donne accès à la totalité du Web; le web invisible reste inaccessibles aux MDR classiques.