Moteurs de recherche, catalogues et annuaires Internet
Définition : Moteur de recherche
Un moteur de recherche est un site web dont la principale fonctionnalité est la recherche de ressources par mots clés.
Il fonctionne ainsi :
1. Il explore régulièrement la toile à l'aide de robots qui parcourent les sites de façon automatique (sans intervention humaine) et suivent tous les liens
rencontrés
2. Il indexe les pages visitées en rangeant les mots significatifs de la page dans une base de données
3. Il répond à la requête d'un internaute en affichant par ordre de pertinence les pages indexées dans sa base de données qui correspondent le mieux à la
requête
Les moteurs de recherche indexent des pages en parcourant les hyperliens.
De nombreuses ressources ne peuvent pas être atteintes de cette façon :
Les bases données
Les catalogues de bibliothèque
Les pages dynamiques
Les pages non pointées
Les pages nécessitant une identification
On estime que moins de 10% des ressources du web sont accessibles par les moteurs de recherche classique !
L'indexation
Les robots des moteurs de recherche parcourent le web en suivant les hyperliens.
Pour chaque page visitée :
Ils relèvent les mots significatifs de la page et les conservent en les associant à l'URL de la page
Ils gardent une copie de la page
Attention : Les moteurs de recherche ont de la mémoire !
Pour chaque page web indexée, le moteur de recherche conserve une copie de la page au moment de son indexation ...
Même si vous enlevez une information ou un photo d'une page web, elle restera encore accessible un certain temps dans les pages en cache des moteurs de
recherche
La recherche simple
En général, quand vous indiquez plusieurs mots clés pour votre recherche :
il exclut les mots non significatifs (le, la, une, à, ...)
il recherche les pages contenant tous les mots clés relativement proches sur la page.
Il est possible d'affiner la recherche :
Soit en passant par la recherche avancée ...
Soit en personnalisant votre requête :
en mettant un - devant les mots à exclure
en mettant les expressions exactes entre guillemets
en proposant une liste de mots au choix séparés par OR
Le résultat
Chaque moteur a ses propres règles pour établir la pertinence d'une page par rapport à une requête.
En voici quelques unes :
Les mots recherchés doivent être voisins sur la page
Pour chaque page web, un "indice de popularité" est calculé en fonction du nombre et de l'importance des sites référençant cette page.
Définition : Notice bibliographique
Une notice est la fiche descriptive d'une ressource de bibliothèque : livres, revues,
ressources électroniques, médias, ...
Définition : Catalogue de bibliothèque
Un catalogue de bibliothèque recense les différentes notices des ressources de
bibliothèque.
La recherche avancée
On peut combiner la recherche sur plusieurs champs en même temps : Titre,Sujet, Auteur, Éditeur, ...
On peut indiquer s'il faut vérifier toutes les conditions (ET) ou seulement certaines (OU)
On peut compléter un mot par *, ce qui permet d'étendre la recherche à tous les mots ayant cette racine
Exemple : Le catalogue du SUDOC
Le catalogue du Système Universitaire de Documentation4 est le catalogue collectif français réalisé par les bibliothèques et centres de documentation de l'enseignement supérieur et de la recherche.
Définition : Annuaire de recherche
Un annuaire de recherche est un site web proposant une sélection de ressources du web (URL) classées par thèmes hiérarchisés.
A noter :
La mise à jour d'un annuaire est faite par des personnes (et non par une machine)
Un annuaire recense moins de pages qu'un moteur de recherche automatisé mais elles sont théoriquement plus pertinentes.