đź“š Espace CDI

Les moteurs de recherche

PubliĂ© le samedi 23 mai 2015 13:24 - Mis Ă  jour le mardi 27 juin 2023 12:12

Retour à la page précédente​

 

 Qu'est-ce qu'un moteur ? Comment ça marche ? 



Les moteurs de recherche sont des logiciels robotisés qui indexent les pages de manière automatique. Cet index est réalisé à partir d'une extraction des mots de la page. La recherche s'effectue donc en texte intégral, c'est-à-dire sur l'ensemble du contenu des pages web. Lors de la recherche, le moteur cherche ainsi l'occurence des mots-clés formulés dans l'ensemble des termes contenus dans la page, même s'ils ne sont pas tous représentatifs de son contenu. C'est pourquoi, les moteurs proposent souvent un grand nombre de résultats non pertinents. Les résultats sont ensuite classés automatiquement en fonction de leur pertinence (c'est-à-dire de leur adéquation avec la question posée). Celle-ci est calculée différemment selon les moteurs et prend généralement en compte la fréquence d'apparition du mot-clé dans la page, son emplacement et enfin la popularité de la page (calculée à partir du nombre de liens hypertextes sur le Web qui pointent vers elle).

Dans quels cas utiliser un moteur de recherche ?

  • Pour rechercher des informations rĂ©centes
  • Pour trouver des informations prĂ©cises sur une personne, un organisme, un produit...
  • Pour effectuer une recherche complexe
AVANTAGES INCONVENIENTS

Exhaustivité

Beaucoup de réponses non pertinentes

Mise à jour fréquente

Pas de classement raisonné

Comment rechercher avec un moteur :

Les résultats proposés par les moteurs de recherche sont très élevés et pas toujours pertinents, d'où la nécessité d'utiliser plusieurs mots-clés et/ou de passer par la « recherche avancée » qui permet de restreindre la recherche. Pour limiter une recherche, on peut utiliser :

  • Les opĂ©rateurs boolĂ©ens ET (pour obtenir des documents contenant Ă  la fois les deux mots clĂ©s formulĂ©s) et SAUF (pour obtenir des documents contenant le premier mot-clĂ©, mais pas le second).
  • L'opĂ©rateur d'adjacence qui permet de rechercher une expression exacte. On doit pour cela placer l'expression entre guillemets.
  • La troncature, c'est-Ă -dire l’ajout du signe * Ă  la fin d’un mot, permet de rechercher tous les mots dĂ©rivĂ©s d'une mĂŞme racine. Cela peut permettre de faire porter la recherche Ă  la fois sur le singulier et le pluriel d'un mot, ou sur le fĂ©minin et le masculin.
  • Il est Ă©galement possible en utilisant le mode de recherche avancĂ©e de limiter la recherche Ă  des pages modifiĂ©es après une certaine date lorsque l'on recherche des informations rĂ©centes. On peut aussi la limiter Ă  un site donnĂ©, Ă  une langue, Ă  un certain format de fichier, Ă  un certain emplacement dans la page (dans le titre, dans les liens)...

Certaines règles doivent être respectées lorsque l'on formule sa requête : orthographe correcte, pas de phrases complètes mais des mots-clés, pas de déterminants, de prépositions ... (ce sont des mots vides sans signification propre et ils ne sont donc pas pris en compte par les moteurs). Evitez d'utiliser un mot ayant plusieurs sens car vous risqueriez d'avoir un grand nombre de réponses hors sujet.

Quelques moteurs de recherche à connaître :

  • Lilo : chaque recherche sur ce moteur aide Ă  financer des projets sociaux et environnementaux.
  • Exalead : excellent moteur français qui, lors du lancement de la recherche, offre de nombreux Ă©lĂ©ments pour aider Ă  affiner la recherche : proposition de mots-clĂ©s associĂ©s pour affiner sa requĂŞte, possibilitĂ© de limiter la recherche Ă  un type de site, de fichier, Ă  une langue...
  • Google : le plus utilisĂ©. La taille de son index est très importante, c'est pourquoi, il permet de rechercher dans un très grand nombre de pages web.
  • Qwant : moteur de recherche qui respecte votre vie privĂ©e.
  • Yahoo : il offre de bonnes possibilitĂ©s de paramĂ©trage, mais a une tendance marchande trop marquĂ©e, avec notamment l'importante prĂ©sence des liens promotionnels.

 Les annuaires, mais qu'est ce qu'un annuaire ?



Les annuaires (aussi appelés "répertoires") proposent une sélection de sites web en fonction de grandes thématiques. Les sites sont décrits et organisés de manière hiérarchique en catégories et sous-catégories selon le principe de l'arborescence. Ce travail est réalisé par des humains, et non par des machines.

Dans quels cas utiliser un annuaire ?

  • Pour explorer un sujet, le dĂ©fricher
  • Pour repĂ©rer les sites indispensables sur un thème
  • Pour trouver des sites similaires
AVANTAGES INCONVENIENTS

Les sites sont sélectionnés et classés en catégories et sous-catégories, donc la recherche est plus pertinente.

Manque d'exhaustivité

Les sites sont décrits : titre, phrase de présentation, adresse URL et incription dans une catégorie

Mise Ă  jour peu rapide

Pour les annuaires sélectifs comme celui du CDI ou celui de la BNF, on est assuré d'une certaine qualité et fiabilité de l'information

Sélection de sites et non de pages spécifiques

Comment rechercher avec un annuaire ?

Il existe deux possiblilités de recherche :

  • une recherche par navigation à partir des catĂ©gories et sous-catĂ©gories thĂ©matiques, en partant du gĂ©nĂ©ral pour aller vers le particulier.
  • une recherche par mots-clĂ©s comme les moteurs de recherche. La diffĂ©rence est que pour un annuaire, l'occurence du mot-clĂ© (c'est-Ă -dire sa prĂ©sence dans la page) est recherchĂ©e dans la description des sites (titre, adresse URL, phrase de prĂ©sentation), et non dans le contenu des pages web.

Sélection d'annuaires à connaître :

  • Les signets de la BNF : une sĂ©lection commentĂ©e de ressources en ligne, choisies par des professionnels : les bibliothĂ©caires de la Bibliothèque nationale de France. Les signets sont classĂ©s  selon une classification dĂ©cimale, comme les documents du CDI. La description y est plus prĂ©cise que dans un annuaire classique, et les sites sont ici sĂ©lectionnĂ©s pour leur qualitĂ© et fiabilitĂ©.
  • Dmoz - Open Directory Project : un annuaire de site complet. Il est Ă©ditĂ©, dĂ©veloppĂ© et maintenu par une vaste communautĂ© mondiale d'Ă©diteurs bĂ©nĂ©voles.
  • L'annuaire de Yahoo
  •  
  •  

  Les Métamoteurs, mais qu'est ce qu'un métamoteur ?


 

Il interroge simultanément plusieurs moteurs et annuaires à partir d’une même requête. Il élimine les doublons et récapitule généralement les résultats sous la forme d’une seule liste. Les métamoteurs trient et organisent les résultats selon des méthodes spécifiques. 

Dans quels cas utiliser un métamoteur ?

  • Pour avoir un grand nombre de pages sur un sujet sans avoir Ă  utiliser plusieurs outils de recherche Ă  la suite (puisque pour une mĂŞme requĂŞte les rĂ©sultats fournis par plusieurs moteurs seront très diffĂ©rents)
  • Pour faire des recherches larges
AVANTAGES INCONVENIENTS

Gain de temps puisqu'on interroge simultanément plusieurs outils de recherche

Beaucoup de réponses non pertinentes comme pour les moteurs

Plus grande exhaustivité

Peu efficace pour des recherches pointues. En effet, on ne peut formuler des requĂŞtes complexes puisque les outils de recherche n'ont pas tous la mĂŞme syntaxe

Exemple de métamoteur à connaître :

  • Startpage : il interroge une quinzaine de moteurs en 16 langues et propose un classement des rĂ©sultats par une Ă©valuation de pertinence signifiĂ©e par des Ă©toiles Ă  cĂ´tĂ© du site.  On peut ensuite corriger les rĂ©sultats en utilisant le « X » pour supprimer un rĂ©sultat ou « racine carrĂ©e » pour en demander d'autres de mĂŞme nature.  

Les annuaires et moteurs de recherche peuvent être généralistes ou 
spécialisés dans un domaine précis de connaissance ou pour un type de public spécifique.

Tableau récapitulatif des principaux éléments de syntaxe permettant d'effectuer une recherche complexe à l'aide de Google (moteur et annuaire), Exalead et Yahoo (moteur et annuaire), élaboré par Guy Forzy.  

 

Retour à la page précédente​