Moteurs de recherche, catalogues et annuaires Internet

DéfinitionMoteur de recherche

Un moteur de recherche est un site web dont la principale fonctionnalité est la recherche de ressources par mots clés.

Il fonctionne ainsi :

1. Il explore régulièrement la toile à l'aide de robots qui parcourent les sites de façon automatique (sans intervention humaine) et suivent tous les liens

rencontrés

2. Il indexe les pages visitées en rangeant les mots significatifs de la page dans une base de données

3. Il répond à la requête d'un internaute en affichant par ordre de pertinence les pages indexées dans sa base de données qui correspondent le mieux à la

requête

Les moteurs de recherche indexent des pages en parcourant les hyperliens.

De nombreuses ressources ne peuvent pas être atteintes de cette façon :

  • Les bases données

  • Les catalogues de bibliothèque

  • Les pages dynamiques

  • Les pages non pointées

  • Les pages nécessitant une identification

On estime que moins de 10% des ressources du web sont accessibles par les moteurs de recherche classique !

L'indexation

Les robots des moteurs de recherche parcourent le web en suivant les hyperliens.

Pour chaque page visitée :

  • Ils relèvent les mots significatifs de la page et les conservent en les associant à l'URL de la page

  • Ils gardent une copie de la page

AttentionLes moteurs de recherche ont de la mémoire !

Pour chaque page web indexée, le moteur de recherche conserve une copie de la page au moment de son indexation ...

Même si vous enlevez une information ou un photo d'une page web, elle restera encore accessible un certain temps dans les pages en cache des moteurs de

recherche

La recherche simple

En général, quand vous indiquez plusieurs mots clés pour votre recherche :

  • il exclut les mots non significatifs (le, la, une, à, ...)

  • il recherche les pages contenant tous les mots clés relativement proches sur la page.

Il est possible d'affiner la recherche :

  • Soit en passant par la recherche avancée ...

  • Soit en personnalisant votre requête :

  1. en mettant un - devant les mots à exclure

  2. en mettant les expressions exactes entre guillemets

  3. en proposant une liste de mots au choix séparés par OR

Le résultat

Chaque moteur a ses propres règles pour établir la pertinence d'une page par rapport à une requête.

En voici quelques unes :

  • Les mots recherchés doivent être voisins sur la page

  • Pour chaque page web, un "indice de popularité" est calculé en fonction du nombre et de l'importance des sites référençant cette page.

DéfinitionNotice bibliographique

Une notice est la fiche descriptive d'une ressource de bibliothèque : livres, revues,

ressources électroniques, médias, ...

DéfinitionCatalogue de bibliothèque

Un catalogue de bibliothèque recense les différentes notices des ressources de

bibliothèque.

La recherche avancée

  • On peut combiner la recherche sur plusieurs champs en même temps : Titre,Sujet, Auteur, Éditeur, ...

  • On peut indiquer s'il faut vérifier toutes les conditions (ET) ou seulement certaines (OU)

  • On peut compléter un mot par *, ce qui permet d'étendre la recherche à tous les mots ayant cette racine

ExempleLe catalogue du SUDOC

Le catalogue du Système Universitaire de Documentation4 est le catalogue collectif français réalisé par les bibliothèques et centres de documentation de l'enseignement supérieur et de la recherche.

DéfinitionAnnuaire de recherche

Un annuaire de recherche est un site web proposant une sélection de ressources du web (URL) classées par thèmes hiérarchisés.

A noter :

  • La mise à jour d'un annuaire est faite par des personnes (et non par une machine)

  • Un annuaire recense moins de pages qu'un moteur de recherche automatisé mais elles sont théoriquement plus pertinentes.