Espace CDI

Les moteurs de recherche

Publié le samedi 23 mai 2015 13:24 - Mis à jour le mardi 27 juin 2023 12:12

Retour à la page précédente​

 

 Qu'est-ce qu'un moteur ? Comment ça marche ? 



Les moteurs de recherche sont des logiciels robotisés qui indexent les pages de manière automatique. Cet index est réalisé à partir d'une extraction des mots de la page. La recherche s'effectue donc en texte intégral, c'est-à-dire sur l'ensemble du contenu des pages web. Lors de la recherche, le moteur cherche ainsi l'occurence des mots-clés formulés dans l'ensemble des termes contenus dans la page, même s'ils ne sont pas tous représentatifs de son contenu. C'est pourquoi, les moteurs proposent souvent un grand nombre de résultats non pertinents. Les résultats sont ensuite classés automatiquement en fonction de leur pertinence (c'est-à-dire de leur adéquation avec la question posée). Celle-ci est calculée différemment selon les moteurs et prend généralement en compte la fréquence d'apparition du mot-clé dans la page, son emplacement et enfin la popularité de la page (calculée à partir du nombre de liens hypertextes sur le Web qui pointent vers elle).

Dans quels cas utiliser un moteur de recherche ?

  • Pour rechercher des informations récentes
  • Pour trouver des informations précises sur une personne, un organisme, un produit...
  • Pour effectuer une recherche complexe
AVANTAGES INCONVENIENTS

Exhaustivité

Beaucoup de réponses non pertinentes

Mise à jour fréquente

Pas de classement raisonné

Comment rechercher avec un moteur :

Les résultats proposés par les moteurs de recherche sont très élevés et pas toujours pertinents, d'où la nécessité d'utiliser plusieurs mots-clés et/ou de passer par la « recherche avancée » qui permet de restreindre la recherche. Pour limiter une recherche, on peut utiliser :

  • Les opérateurs booléens ET (pour obtenir des documents contenant à la fois les deux mots clés formulés) et SAUF (pour obtenir des documents contenant le premier mot-clé, mais pas le second).
  • L'opérateur d'adjacence qui permet de rechercher une expression exacte. On doit pour cela placer l'expression entre guillemets.
  • La troncature, c'est-à-dire l’ajout du signe * à la fin d’un mot, permet de rechercher tous les mots dérivés d'une même racine. Cela peut permettre de faire porter la recherche à la fois sur le singulier et le pluriel d'un mot, ou sur le féminin et le masculin.
  • Il est également possible en utilisant le mode de recherche avancée de limiter la recherche à des pages modifiées après une certaine date lorsque l'on recherche des informations récentes. On peut aussi la limiter à un site donné, à une langue, à un certain format de fichier, à un certain emplacement dans la page (dans le titre, dans les liens)...

Certaines règles doivent être respectées lorsque l'on formule sa requête : orthographe correcte, pas de phrases complètes mais des mots-clés, pas de déterminants, de prépositions ... (ce sont des mots vides sans signification propre et ils ne sont donc pas pris en compte par les moteurs). Evitez d'utiliser un mot ayant plusieurs sens car vous risqueriez d'avoir un grand nombre de réponses hors sujet.

Quelques moteurs de recherche à connaître :

  • Lilo : chaque recherche sur ce moteur aide à financer des projets sociaux et environnementaux.
  • Exalead : excellent moteur français qui, lors du lancement de la recherche, offre de nombreux éléments pour aider à affiner la recherche : proposition de mots-clés associés pour affiner sa requête, possibilité de limiter la recherche à un type de site, de fichier, à une langue...
  • Google : le plus utilisé. La taille de son index est très importante, c'est pourquoi, il permet de rechercher dans un très grand nombre de pages web.
  • Qwant : moteur de recherche qui respecte votre vie privée.
  • Yahoo : il offre de bonnes possibilités de paramétrage, mais a une tendance marchande trop marquée, avec notamment l'importante présence des liens promotionnels.

 Les annuaires, mais qu'est ce qu'un annuaire ?



Les annuaires (aussi appelés "répertoires") proposent une sélection de sites web en fonction de grandes thématiques. Les sites sont décrits et organisés de manière hiérarchique en catégories et sous-catégories selon le principe de l'arborescence. Ce travail est réalisé par des humains, et non par des machines.

Dans quels cas utiliser un annuaire ?

  • Pour explorer un sujet, le défricher
  • Pour repérer les sites indispensables sur un thème
  • Pour trouver des sites similaires
AVANTAGES INCONVENIENTS

Les sites sont sélectionnés et classés en catégories et sous-catégories, donc la recherche est plus pertinente.

Manque d'exhaustivité

Les sites sont décrits : titre, phrase de présentation, adresse URL et incription dans une catégorie

Mise à jour peu rapide

Pour les annuaires sélectifs comme celui du CDI ou celui de la BNF, on est assuré d'une certaine qualité et fiabilité de l'information

Sélection de sites et non de pages spécifiques

Comment rechercher avec un annuaire ?

Il existe deux possiblilités de recherche :

  • une recherche par navigation à partir des catégories et sous-catégories thématiques, en partant du général pour aller vers le particulier.
  • une recherche par mots-clés comme les moteurs de recherche. La différence est que pour un annuaire, l'occurence du mot-clé (c'est-à-dire sa présence dans la page) est recherchée dans la description des sites (titre, adresse URL, phrase de présentation), et non dans le contenu des pages web.

Sélection d'annuaires à connaître :

  • Les signets de la BNF : une sélection commentée de ressources en ligne, choisies par des professionnels : les bibliothécaires de la Bibliothèque nationale de France. Les signets sont classés  selon une classification décimale, comme les documents du CDI. La description y est plus précise que dans un annuaire classique, et les sites sont ici sélectionnés pour leur qualité et fiabilité.
  • Dmoz - Open Directory Project : un annuaire de site complet. Il est édité, développé et maintenu par une vaste communauté mondiale d'éditeurs bénévoles.
  • L'annuaire de Yahoo
  •  
  •  

  Les Métamoteurs, mais qu'est ce qu'un métamoteur ?


 

Il interroge simultanément plusieurs moteurs et annuaires à partir d’une même requête. Il élimine les doublons et récapitule généralement les résultats sous la forme d’une seule liste. Les métamoteurs trient et organisent les résultats selon des méthodes spécifiques. 

Dans quels cas utiliser un métamoteur ?

  • Pour avoir un grand nombre de pages sur un sujet sans avoir à utiliser plusieurs outils de recherche à la suite (puisque pour une même requête les résultats fournis par plusieurs moteurs seront très différents)
  • Pour faire des recherches larges
AVANTAGES INCONVENIENTS

Gain de temps puisqu'on interroge simultanément plusieurs outils de recherche

Beaucoup de réponses non pertinentes comme pour les moteurs

Plus grande exhaustivité

Peu efficace pour des recherches pointues. En effet, on ne peut formuler des requêtes complexes puisque les outils de recherche n'ont pas tous la même syntaxe

Exemple de métamoteur à connaître :

  • Startpage : il interroge une quinzaine de moteurs en 16 langues et propose un classement des résultats par une évaluation de pertinence signifiée par des étoiles à côté du site.  On peut ensuite corriger les résultats en utilisant le « X » pour supprimer un résultat ou « racine carrée » pour en demander d'autres de même nature.  

Les annuaires et moteurs de recherche peuvent être généralistes ou 
spécialisés dans un domaine précis de connaissance ou pour un type de public spécifique.

Tableau récapitulatif des principaux éléments de syntaxe permettant d'effectuer une recherche complexe à l'aide de Google (moteur et annuaire), Exalead et Yahoo (moteur et annuaire), élaboré par Guy Forzy.  

 

Retour à la page précédente​