Les moteurs de recherche
Retour Ă la page prĂ©cĂ©denteâ
Â
|
Les moteurs de recherche sont des logiciels robotisĂ©s qui indexent les pages de maniĂšre automatique. Cet index est rĂ©alisĂ© Ă partir d'une extraction des mots de la page. La recherche s'effectue donc en texte intĂ©gral, c'est-Ă -dire sur l'ensemble du contenu des pages web. Lors de la recherche, le moteur cherche ainsi l'occurence des mots-clĂ©s formulĂ©s dans l'ensemble des termes contenus dans la page, mĂȘme s'ils ne sont pas tous reprĂ©sentatifs de son contenu. C'est pourquoi, les moteurs proposent souvent un grand nombre de rĂ©sultats non pertinents. Les rĂ©sultats sont ensuite classĂ©s automatiquement en fonction de leur pertinence (c'est-Ă -dire de leur adĂ©quation avec la question posĂ©e). Celle-ci est calculĂ©e diffĂ©remment selon les moteurs et prend gĂ©nĂ©ralement en compte la frĂ©quence d'apparition du mot-clĂ© dans la page, son emplacement et enfin la popularitĂ© de la page (calculĂ©e Ă partir du nombre de liens hypertextes sur le Web qui pointent vers elle).
Dans quels cas utiliser un moteur de recherche ?
- Pour rechercher des informations récentes
- Pour trouver des informations précises sur une personne, un organisme, un produit...
- Pour effectuer une recherche complexe
| AVANTAGES | INCONVENIENTS |
| Exhaustivité |
Beaucoup de réponses non pertinentes |
| Mise à jour fréquente |
Pas de classement raisonné |
Comment rechercher avec un moteur :
Les rĂ©sultats proposĂ©s par les moteurs de recherche sont trĂšs Ă©levĂ©s et pas toujours pertinents, d'oĂč la nĂ©cessitĂ© d'utiliser plusieurs mots-clĂ©s et/ou de passer par la « recherche avancĂ©e » qui permet de restreindre la recherche. Pour limiter une recherche, on peut utiliser :
- Les opérateurs booléens ET (pour obtenir des documents contenant à la fois les deux mots clés formulés) et SAUF (pour obtenir des documents contenant le premier mot-clé, mais pas le second).
- L'opérateur d'adjacence qui permet de rechercher une expression exacte. On doit pour cela placer l'expression entre guillemets.
- La troncature, c'est-Ă -dire lâajout du signe * Ă la fin dâun mot, permet de rechercher tous les mots dĂ©rivĂ©s d'une mĂȘme racine. Cela peut permettre de faire porter la recherche Ă la fois sur le singulier et le pluriel d'un mot, ou sur le fĂ©minin et le masculin.
- Il est également possible en utilisant le mode de recherche avancée de limiter la recherche à des pages modifiées aprÚs une certaine date lorsque l'on recherche des informations récentes. On peut aussi la limiter à un site donné, à une langue, à un certain format de fichier, à un certain emplacement dans la page (dans le titre, dans les liens)...
Certaines rĂšgles doivent ĂȘtre respectĂ©es lorsque l'on formule sa requĂȘte : orthographe correcte, pas de phrases complĂštes mais des mots-clĂ©s, pas de dĂ©terminants, de prĂ©positions ... (ce sont des mots vides sans signification propre et ils ne sont donc pas pris en compte par les moteurs). Evitez d'utiliser un mot ayant plusieurs sens car vous risqueriez d'avoir un grand nombre de rĂ©ponses hors sujet.
Quelques moteurs de recherche Ă connaĂźtre :
- Lilo : chaque recherche sur ce moteur aide Ă financer des projets sociaux et environnementaux.
- Exalead : excellent moteur français qui, lors du lancement de la recherche, offre de nombreux Ă©lĂ©ments pour aider Ă affiner la recherche : proposition de mots-clĂ©s associĂ©s pour affiner sa requĂȘte, possibilitĂ© de limiter la recherche Ă un type de site, de fichier, Ă une langue...
- Google : le plus utilisé. La taille de son index est trÚs importante, c'est pourquoi, il permet de rechercher dans un trÚs grand nombre de pages web.
- Qwant : moteur de recherche qui respecte votre vie privée.
- Yahoo : il offre de bonnes possibilités de paramétrage, mais a une tendance marchande trop marquée, avec notamment l'importante présence des liens promotionnels.
|
|
Les annuaires (aussi appelés "répertoires") proposent une sélection de sites web en fonction de grandes thématiques. Les sites sont décrits et organisés de maniÚre hiérarchique en catégories et sous-catégories selon le principe de l'arborescence. Ce travail est réalisé par des humains, et non par des machines.
Dans quels cas utiliser un annuaire ?
- Pour explorer un sujet, le défricher
- Pour repérer les sites indispensables sur un thÚme
- Pour trouver des sites similaires
| AVANTAGES | INCONVENIENTS |
| Les sites sont sélectionnés et classés en catégories et sous-catégories, donc la recherche est plus pertinente. |
Manque d'exhaustivité |
| Les sites sont décrits : titre, phrase de présentation, adresse URL et incription dans une catégorie |
Mise Ă jour peu rapide |
| Pour les annuaires sélectifs comme celui du CDI ou celui de la BNF, on est assuré d'une certaine qualité et fiabilité de l'information |
Sélection de sites et non de pages spécifiques |
Comment rechercher avec un annuaire ?
Il existe deux possiblilités de recherche :
- une recherche par navigation à partir des catégories et sous-catégories thématiques, en partant du général pour aller vers le particulier.
- une recherche par mots-clés comme les moteurs de recherche. La différence est que pour un annuaire, l'occurence du mot-clé (c'est-à -dire sa présence dans la page) est recherchée dans la description des sites (titre, adresse URL, phrase de présentation), et non dans le contenu des pages web.
Sélection d'annuaires à connaßtre :
- Les signets de la BNF : une sélection commentée de ressources en ligne, choisies par des professionnels : les bibliothécaires de la BibliothÚque nationale de France. Les signets sont classés  selon une classification décimale, comme les documents du CDI. La description y est plus précise que dans un annuaire classique, et les sites sont ici sélectionnés pour leur qualité et fiabilité.
- Dmoz - Open Directory Project : un annuaire de site complet. Il est édité, développé et maintenu par une vaste communauté mondiale d'éditeurs bénévoles.
- L'annuaire de Yahoo
- Â
- Â
|
|
Â
Il interroge simultanĂ©ment plusieurs moteurs et annuaires Ă partir dâune mĂȘme requĂȘte. Il Ă©limine les doublons et rĂ©capitule gĂ©nĂ©ralement les rĂ©sultats sous la forme dâune seule liste. Les mĂ©tamoteurs trient et organisent les rĂ©sultats selon des mĂ©thodes spĂ©cifiques.Â
Dans quels cas utiliser un métamoteur ?
- Pour avoir un grand nombre de pages sur un sujet sans avoir Ă utiliser plusieurs outils de recherche Ă la suite (puisque pour une mĂȘme requĂȘte les rĂ©sultats fournis par plusieurs moteurs seront trĂšs diffĂ©rents)
- Pour faire des recherches larges
| AVANTAGES | INCONVENIENTS |
| Gain de temps puisqu'on interroge simultanément plusieurs outils de recherche |
Beaucoup de réponses non pertinentes comme pour les moteurs |
| Plus grande exhaustivité |
Peu efficace pour des recherches pointues. En effet, on ne peut formuler des requĂȘtes complexes puisque les outils de recherche n'ont pas tous la mĂȘme syntaxe |
Exemple de métamoteur à connaßtre :
- Startpage : il interroge une quinzaine de moteurs en 16 langues et propose un classement des rĂ©sultats par une Ă©valuation de pertinence signifiĂ©e par des Ă©toiles Ă cĂŽtĂ© du site. On peut ensuite corriger les rĂ©sultats en utilisant le « X » pour supprimer un rĂ©sultat ou « racine carrĂ©e » pour en demander d'autres de mĂȘme nature. Â
Les annuaires et moteurs de recherche peuvent ĂȘtre gĂ©nĂ©ralistes ouÂ
spécialisés dans un domaine précis de connaissance ou pour un type de public spécifique.
Tableau rĂ©capitulatif des principaux Ă©lĂ©ments de syntaxe permettant d'effectuer une recherche complexe Ă l'aide de Google (moteur et annuaire), Exalead et Yahoo (moteur et annuaire), Ă©laborĂ© par Guy Forzy. Â
Â