📚 Espace CDI

Les moteurs de recherche

PubliĂ© le samedi 23 mai 2015 13:24 - Mis Ă  jour le mardi 27 juin 2023 12:12

Retour Ă  la page prĂ©cĂ©dente​

 

 Qu'est-ce qu'un moteur ? Comment ça marche ? 



Les moteurs de recherche sont des logiciels robotisĂ©s qui indexent les pages de maniĂšre automatique. Cet index est rĂ©alisĂ© Ă  partir d'une extraction des mots de la page. La recherche s'effectue donc en texte intĂ©gral, c'est-Ă -dire sur l'ensemble du contenu des pages web. Lors de la recherche, le moteur cherche ainsi l'occurence des mots-clĂ©s formulĂ©s dans l'ensemble des termes contenus dans la page, mĂȘme s'ils ne sont pas tous reprĂ©sentatifs de son contenu. C'est pourquoi, les moteurs proposent souvent un grand nombre de rĂ©sultats non pertinents. Les rĂ©sultats sont ensuite classĂ©s automatiquement en fonction de leur pertinence (c'est-Ă -dire de leur adĂ©quation avec la question posĂ©e). Celle-ci est calculĂ©e diffĂ©remment selon les moteurs et prend gĂ©nĂ©ralement en compte la frĂ©quence d'apparition du mot-clĂ© dans la page, son emplacement et enfin la popularitĂ© de la page (calculĂ©e Ă  partir du nombre de liens hypertextes sur le Web qui pointent vers elle).

Dans quels cas utiliser un moteur de recherche ?

  • Pour rechercher des informations rĂ©centes
  • Pour trouver des informations prĂ©cises sur une personne, un organisme, un produit...
  • Pour effectuer une recherche complexe
AVANTAGES INCONVENIENTS

Exhaustivité

Beaucoup de réponses non pertinentes

Mise à jour fréquente

Pas de classement raisonné

Comment rechercher avec un moteur :

Les rĂ©sultats proposĂ©s par les moteurs de recherche sont trĂšs Ă©levĂ©s et pas toujours pertinents, d'oĂč la nĂ©cessitĂ© d'utiliser plusieurs mots-clĂ©s et/ou de passer par la « recherche avancĂ©e » qui permet de restreindre la recherche. Pour limiter une recherche, on peut utiliser :

  • Les opĂ©rateurs boolĂ©ens ET (pour obtenir des documents contenant Ă  la fois les deux mots clĂ©s formulĂ©s) et SAUF (pour obtenir des documents contenant le premier mot-clĂ©, mais pas le second).
  • L'opĂ©rateur d'adjacence qui permet de rechercher une expression exacte. On doit pour cela placer l'expression entre guillemets.
  • La troncature, c'est-Ă -dire l’ajout du signe * Ă  la fin d’un mot, permet de rechercher tous les mots dĂ©rivĂ©s d'une mĂȘme racine. Cela peut permettre de faire porter la recherche Ă  la fois sur le singulier et le pluriel d'un mot, ou sur le fĂ©minin et le masculin.
  • Il est Ă©galement possible en utilisant le mode de recherche avancĂ©e de limiter la recherche Ă  des pages modifiĂ©es aprĂšs une certaine date lorsque l'on recherche des informations rĂ©centes. On peut aussi la limiter Ă  un site donnĂ©, Ă  une langue, Ă  un certain format de fichier, Ă  un certain emplacement dans la page (dans le titre, dans les liens)...

Certaines rĂšgles doivent ĂȘtre respectĂ©es lorsque l'on formule sa requĂȘte : orthographe correcte, pas de phrases complĂštes mais des mots-clĂ©s, pas de dĂ©terminants, de prĂ©positions ... (ce sont des mots vides sans signification propre et ils ne sont donc pas pris en compte par les moteurs). Evitez d'utiliser un mot ayant plusieurs sens car vous risqueriez d'avoir un grand nombre de rĂ©ponses hors sujet.

Quelques moteurs de recherche Ă  connaĂźtre :

  • Lilo : chaque recherche sur ce moteur aide Ă  financer des projets sociaux et environnementaux.
  • Exalead : excellent moteur français qui, lors du lancement de la recherche, offre de nombreux Ă©lĂ©ments pour aider Ă  affiner la recherche : proposition de mots-clĂ©s associĂ©s pour affiner sa requĂȘte, possibilitĂ© de limiter la recherche Ă  un type de site, de fichier, Ă  une langue...
  • Google : le plus utilisĂ©. La taille de son index est trĂšs importante, c'est pourquoi, il permet de rechercher dans un trĂšs grand nombre de pages web.
  • Qwant : moteur de recherche qui respecte votre vie privĂ©e.
  • Yahoo : il offre de bonnes possibilitĂ©s de paramĂ©trage, mais a une tendance marchande trop marquĂ©e, avec notamment l'importante prĂ©sence des liens promotionnels.

 Les annuaires, mais qu'est ce qu'un annuaire ?



Les annuaires (aussi appelés "répertoires") proposent une sélection de sites web en fonction de grandes thématiques. Les sites sont décrits et organisés de maniÚre hiérarchique en catégories et sous-catégories selon le principe de l'arborescence. Ce travail est réalisé par des humains, et non par des machines.

Dans quels cas utiliser un annuaire ?

  • Pour explorer un sujet, le dĂ©fricher
  • Pour repĂ©rer les sites indispensables sur un thĂšme
  • Pour trouver des sites similaires
AVANTAGES INCONVENIENTS

Les sites sont sélectionnés et classés en catégories et sous-catégories, donc la recherche est plus pertinente.

Manque d'exhaustivité

Les sites sont décrits : titre, phrase de présentation, adresse URL et incription dans une catégorie

Mise Ă  jour peu rapide

Pour les annuaires sélectifs comme celui du CDI ou celui de la BNF, on est assuré d'une certaine qualité et fiabilité de l'information

Sélection de sites et non de pages spécifiques

Comment rechercher avec un annuaire ?

Il existe deux possiblilités de recherche :

  • une recherche par navigation à partir des catĂ©gories et sous-catĂ©gories thĂ©matiques, en partant du gĂ©nĂ©ral pour aller vers le particulier.
  • une recherche par mots-clĂ©s comme les moteurs de recherche. La diffĂ©rence est que pour un annuaire, l'occurence du mot-clĂ© (c'est-Ă -dire sa prĂ©sence dans la page) est recherchĂ©e dans la description des sites (titre, adresse URL, phrase de prĂ©sentation), et non dans le contenu des pages web.

Sélection d'annuaires à connaßtre :

  • Les signets de la BNF : une sĂ©lection commentĂ©e de ressources en ligne, choisies par des professionnels : les bibliothĂ©caires de la BibliothĂšque nationale de France. Les signets sont classĂ©s  selon une classification dĂ©cimale, comme les documents du CDI. La description y est plus prĂ©cise que dans un annuaire classique, et les sites sont ici sĂ©lectionnĂ©s pour leur qualitĂ© et fiabilitĂ©.
  • Dmoz - Open Directory Project : un annuaire de site complet. Il est Ă©ditĂ©, dĂ©veloppĂ© et maintenu par une vaste communautĂ© mondiale d'Ă©diteurs bĂ©nĂ©voles.
  • L'annuaire de Yahoo
  •  
  •  

  Les Métamoteurs, mais qu'est ce qu'un métamoteur ?


 

Il interroge simultanĂ©ment plusieurs moteurs et annuaires Ă  partir d’une mĂȘme requĂȘte. Il Ă©limine les doublons et rĂ©capitule gĂ©nĂ©ralement les rĂ©sultats sous la forme d’une seule liste. Les mĂ©tamoteurs trient et organisent les rĂ©sultats selon des mĂ©thodes spĂ©cifiques. 

Dans quels cas utiliser un métamoteur ?

  • Pour avoir un grand nombre de pages sur un sujet sans avoir Ă  utiliser plusieurs outils de recherche Ă  la suite (puisque pour une mĂȘme requĂȘte les rĂ©sultats fournis par plusieurs moteurs seront trĂšs diffĂ©rents)
  • Pour faire des recherches larges
AVANTAGES INCONVENIENTS

Gain de temps puisqu'on interroge simultanément plusieurs outils de recherche

Beaucoup de réponses non pertinentes comme pour les moteurs

Plus grande exhaustivité

Peu efficace pour des recherches pointues. En effet, on ne peut formuler des requĂȘtes complexes puisque les outils de recherche n'ont pas tous la mĂȘme syntaxe

Exemple de métamoteur à connaßtre :

  • Startpage : il interroge une quinzaine de moteurs en 16 langues et propose un classement des rĂ©sultats par une Ă©valuation de pertinence signifiĂ©e par des Ă©toiles Ă  cĂŽtĂ© du site.  On peut ensuite corriger les rĂ©sultats en utilisant le « X » pour supprimer un rĂ©sultat ou « racine carrĂ©e » pour en demander d'autres de mĂȘme nature.  

Les annuaires et moteurs de recherche peuvent ĂȘtre gĂ©nĂ©ralistes ou 
spécialisés dans un domaine précis de connaissance ou pour un type de public spécifique.

Tableau récapitulatif des principaux éléments de syntaxe permettant d'effectuer une recherche complexe à l'aide de Google (moteur et annuaire), Exalead et Yahoo (moteur et annuaire), élaboré par Guy Forzy.  

 

Retour Ă  la page prĂ©cĂ©dente​