Un annuaire est un outil de recherche
qui recense un certain nombre de sites au travers de
fiches descriptives comprenant, en règle générale,
le titre, l'adresse (l'URL) et un bref descriptif d'une
longueur allant le plus souvent de 15 à 25 mots
au maximum. Chaque site est inscrit dans une ou plusieurs
catégorie(s) - on parle également de rubrique(s)
-. Ces outils peuvent ainsi être considérés
comme les pages jaunes du Web.
Lorsqu'un
mot-clé est saisi dans le formulaire proposé,
l'annuaire effectue une recherche sur les occurrences
de ce terme dans ses fiches descriptives de site, et
non pas dans le contenu des pages du site en question.
Il s'agit là de la différence la plus
notable avec les moteurs de recherche. Les annuaires
les plus connus au niveau mondial sont Yahoo!
International, l'Open
Directory et Looksmart.
Au niveau francophone, les plus utilisés sont
Yahoo!
France, Nomade,
le Guide
de Voila, l'annuaire
de Lycos France et l'Open
Directory francophone. Mais il en existe beaucoup
d'autres.
2. Un moteur
de recherche, c'est quoi ?
Le moteur de recherche fonctionne
sur un système radicalement différent
de celui de l'annuaire. Des robots logiciels (appelés
crawlers ou spiders) scrutent le Web, vont de page en
page (en fait de lien en lien) et sauvegardent au fur
et à mesure de leurs pérégrinations
le contenu texte des pages rencontrées, constituant
ainsi un "index", c'est-à-dire une collection
plus ou moins grande de pages Web. La plupart du temps,
les "index" des moteurs mondiaux contiennent plusieurs
centaines de millions de pages web.
Le robot logiciel repasse selon des délais plus
ou moins fréquents sur les pages qu'il a indexées
au préalable, pour en sauvegarder une version
plus récente. On dit alors qu'il "rafraîchit
sa base (ou son index)".
Lorsque l'internaute saisit un mot clé dans le
formulaire proposé, le moteur va en rechercher
les occurrences dans son index, c'est-à-dire
dans le contenu texte des pages Web sauvegardées
au préalable. Une fois le "lot" de pages contenant
le terme demandé identifié, le moteur
classe les pages par ordre de pertinence, selon un ordre
et un algorithme (basé sur certains critères
de tri) qui lui est spécifique.
Le moteur de recherche effectue donc ses recherches
sur des pages Web, alors que l'annuaire vous proposera
des sites Web. Là est toute la différence
qui explique qu'il est absolument impossible de comparer
les résultats fournis par les deux types d'outils.
Les
moteurs de recherche les plus connus sont AltaVista,
Google,
AskJeeves,
AllTheWeb,
MSN
Search et Yahoo
Search. Au niveau francophone, Voila
et Exalead sont
parmi les plus efficaces. Voir :
Description des principaux
moteurs de recherche mondiaux et francophones et
Baromètre
des moteurs de recherche.
3. Un opérateur
booléen, ça veut dire quoi ?
Lorsque l'on désire effectuer
une recherche par mots clés, sur un annuaire
ou un moteur de recherche, il est très souvent
possible et utile de coupler une suite de mots grâce
à ce que l'on appelle des opérateurs booléens.
Ce terme ésotérique (venant du nom de
George Boole, mathématicien britannique) signifie
que vous pouvez élargir ou restreindre votre
recherche en imposant certains mots et en en excluant
d'autres. Il existe plusieurs opérateurs booléens
:
Opérateur
ET
L'opérateur ET permet d'indiquer que la recherche
se fera sur les deux mots saisis, obligatoirement.
Si un document contient uniquement un des deux mots
désirés, il ne sera pas pris en compte
dans le résultat final.
Exemple : recherche sur fibre
ET optique
Le moteur de recherche fournira comme résultat
les pages contenant le mot fibre ET le mot optique.
Si une page contient le mot fibre mais pas le mot
optique, elle ne sera pas prise en compte. L'utilisation
de l'opérateur ET est possible sur un grand
nombre de moteurs de recherche. La plupart du temps,
il est symbolisé par son équivalent
anglais AND ou par le signe +.
L'opérateur ET est souvent celui qui est pris
en compte par défaut (si l'on ne saisit rien
d'autre qu'un espace entre les mots tapés)
sur un grand nombre de moteurs de recherche. Opérateur OU
L'opérateur OU permet d'indiquer au moteur
de recherche qu'il doit prendre en compte les pages
qui contiennent soit l'un des mots saisis, soit l'autre,
soit les deux. Il s'agit ici de la réunion
des deux ensembles.
Exemple : Recherche sur fibre
OU optique.
Si une page contient seulement un des deux mots, elle
sera prise en compte et affichée. De la même
façon, une page contenant les deux termes saisis
sera également notifiée. Il est la plupart
du temps symbolisé par son équivalent
anglais OR ou par l'espace lorsqu'il est pris par
défaut. Opérateur SAUF
Cet opérateur permet d'exclure toutes les pages
qui contiendraient un mot non désiré.
Exemple : Recherche sur fibre
SAUF optique
Dans ce cas, le moteur cherchera les pages contenant
le mot fibre mais ne prendra pas en compte celles
contenant le mot optique. Il s'agit ici d'une exclusion.
Lorsqu'il est possible de l'utiliser, l'opérateur
SAUF est symbolisé par son équivalent
anglais NOT, ou AND NOT, ou encore par le signe -. Parenthèses
Il est parfois possible de coupler plusieurs opérateurs
booléens en utilisant des parenthèses.
Exemple : Recherche sur (fibre
ET optique) OU télécommunications
La recherche portera alors soit sur les pages contenant
à la fois les mots fibre et optique (et non
pas l'un ou l'autre) soit sur les pages contenant
le mot télécommunications, soit les
deux ensemble. Cependant, l'utilisation des parenthèses
n'est pas très répandue sur les moteurs
de recherche à l'heure actuelle. Troncature
Certains moteurs donnent la possibilité d'utiliser
ce que l'on appelle des jokers ou Wildcards. Ils sont
symbolisés, dans la majeure partie des cas,
par le signe *. Ils permettent d'effectuer des troncatures
de mots, c'est-à-dire de ne saisir qu'une partie
du terme désiré.
Exemple : recherche sur le mot opti*
Cet exemple signifie que le moteur recherchera tous
les mots commençant par les quatre lettres
opti : opticien, optique, optical, etc. La troncature
ne peut souvent se faire qu'en fin de mot. Cependant,
certains services acceptent une troncature à
l'intérieur de celui-ci.
Exemple : recherche sur sa*on
Dans ce cas, la recherche s'effectuera sur tous les
mots commençant par sa et finissant par on
: salon, saloon, salutation, etc. Expression
Il est souvent possible de rechercher une expression,
à l'aide des guillemets.
Exemple : recherche sur "new
york"
Dans ce cas, la recherche s'effectuera sur les deux
mots new york, l'un à côté de
l'autre et dans cet ordre. Une page contenant, par
exemple, le mot new au début et york à
la fin ne sera pas prise en compte.
4. Comment
connaître la syntaxe d'interrogation des outils
de recherche ?
La plupart des annuaires et des
moteurs de recherche proposent un lien nommé
"Aide", "Tips" ou "Help" sur leur page d'accueil. Suivez-le,
il vous amènera sur une page vous indiquant la
syntaxe propre à chaque outil. Voir :
La rubrique "syntaxe de saisie" pour chaque moteur
décrit sur ce site.
5. Tous les
outils ont-ils la même syntaxe d'interrogation
(ET, OU, SAUF...) ?
Non, bien entendu, ce serait trop
simple... :-) Mais un standard semble se dégager
: le + pour le ET, utilisé par
défaut (symbolisé par l'espace),
le OR pour le OU, le - pour le SAUF, les guillemets
pour les expressions. Mais les syntaxes avancées
(du genre intitle: ou site: sur Google) sont toutes
différentes d'un outil à l'autre, lorsqu'elles
existent, ce qui est très rare. Voir :
La rubrique "syntaxe de saisie" pour chaque moteur
décrit sur ce site.
6. Est-il
nécessaire de connaître la syntaxe d'interrogation
de ces outils ?
Oui, si vous désirez être
efficace dans vos recherches, il est particulièrement
recommandé de bien connaître au moins la
façon d'utiliser les opérateurs de base
(ET, OU, SAUF, guillemets) de votre outil de recherche
favori. Vous y gagnerez énormément de
temps. Cela est encore plus vrai pour les moteurs de
recherche (par rapport aux annuaires). En effet, pour
une requête trop vague, ces outils donnent rapidement
plusieurs dizaines de milliers de réponses. L'utilisation
des opérateurs est alors nécessaire pour
restreindre la recherche.
7. Est-il
nécessaire de connaître TOUTE la syntaxe
d'interrogation de ces outils ?
Connaître les principales
fonctionnalités vous dépannera déjà
énormément au début. Certaines
fonctions avancées sont très importantes,
d'autres le sont moins. C'est l'expérience qui
vous guidera dans ce cas. Jetez cependant un coup d'oeil
sur toutes ces possibilités pour voir celles
qui peuvent vous servir dans le cadre de votre activité. Voir :
La rubrique "syntaxe de saisie" pour chaque moteur
décrit sur ce site.
8. Combien
ça coûte de consulter ces outils ?
L'utilisation de tous les annuaires
et moteurs de recherche du Web est gratuite pour l'utilisateur.
Le schéma économique de ces outils est
le plus souvent basé sur l'affichage de publicité
sur toutes les pages. Ce sont ainsi les annonceurs qui
payent directement le site.
9. Quel est
le délai de rafraîchissement de l'index
d'un moteur ?
Le délai de rafraîchissement
d'un moteur est le temps passé entre deux passages
de son robot pour sauvegarder une version plus récente
d'une page. Il est d'environ deux à quatre semaines
pour la plupart des moteurs, mais peut, temporairement,
être beaucoup plus "élastique".
10. Un métamoteur,
ce n'est pas mieux qu'un moteur ?
Vaste débat... Les métamoteurs
sont des outils qui, pour une même requête,
interrogent plusieurs moteurs de façon simultanée,
rapatrient les résultats, les synthétisent
et vous proposent un récapitulatif des réponses
données. L'idée est séduisante...
Cependant, il n'est pas permis, sur ces services, d'utiliser
les fonctionnalités avancées des moteurs
de recherche, tout simplement parce qu'elles varient
grandement selon les outils interrogés. Il est
évident que la mise en place de ces fonctionnalités
dans le cadre d'une recherche simultanée sur
plusieurs moteurs est loin d'être aisée,
voire tout simplement impossible.
D'autre part, les métamoteurs font la synthèse
de résultats fournis par plusieurs moteurs différents,
classant chacuns leurs résultats de façons
différentes, sans utiliser les mêmes critères
de pertinence. Une synthèse de documents classés
de façons ainsi disparates est-elle si simple
que celà à effectuer, et surtout, est-elle
plus pertinente ? Peut-on comparer le résultat
de Yahoo! avec celui de Google pour un même mot
clé ? La question reste posée...
L'utilisation de ce type de métamoteurs engendre
un autre problème de fond : quasiment tous les
moteurs de recherche sur lesquels ils s'appuient se
financent grâce aux publicités (bandeaux,
liens sponsorisés) qu'ils affichent. Or, les
promoteurs de cette couche logicielle supplémentaire
que sont les métamoteurs ne répercutent
pas systématiquement (ou pas du tout) ces pubs,
préférant même parfois proposer
leurs propres annonces. Le recours à ces métamoteurs
réduit donc de façon substantielle le
nombre d'accès au moteur de recherche traditionnel,
ce qui compromet ses recettes publicitaires et risque,
à terme, de signer son arrêt de mort.
D'autre part, se pose un problème d'éthique
: est-il juste d'utiliser pour son propre compte les
technologies et investissements mis en oeuvre par d'autres
sociétés, sans contrepartie financière
? Chacun méditera sur ce point...
Bref, si le concept des métamoteurs est intéressant
au départ, je suis, pour ma part, assez persuadé
que la prise en compte d'un seul moteur en utilisant
à fond toutes ses fonctionnalités avancées
en suivant des méthodologies efficaces est plus
fructueuse. Mais je suis prêt à écouter
une théorie contraire bien argumentée
:-).
11. Faut-il
limiter son temps de recherche ?
Oui, sinon vous allez passer des
heures à rechercher sur le Web une information
qui ne s'y trouve peut-être pas !
J'ai tendance à penser qu'en connaissant bien
les outils de recherche et qu'en appliquant les bonnes
méthodologies, on doit savoir deux choses en
une demi-heure (et en un quart d'heure, même,
avec un peu d'expérience) :
1. Si l'info recherchée ne se trouve pas sur
le Web.
2. Dans le cas contraire, on doit avoir identifié
les bonnes sources d'information.
Dans ce cas, le temps de recherche sera alors fonction
de la qualité des sources trouvées : soit
elles sont bien faites et la recherche sera rapide (quelques
minutes), soit elles sont mal faites, et la recherche
sera plus longue. Difficile, ici, de donner des délais,
au vu de la grande disparité de qualité
des sources d'informations disponibles sur le Web.
12. Quand
faut-il utiliser un annuaire et quand faut-il utiliser
un moteur ?
En règle générale,
on peut dire qu'on utilisera un annuaire comme Yahoo!
Directory ou L'Open Directory pour rechercher un site
général sur un sujet donné. On
utilisera, en revanche, un moteur de recherche comme
Google ou Yahoo! Search pour effectuer une recherche
sur un sujet beaucoup plus précis, plus fin.
Pour donner un exemple simple (voire simpliste), on
cherchera le site Web d'une entreprise sur un annuaire,
mais des renseignements sur un de ses produits (recherche
donc à l'intérieur des sites) sur les
moteurs de recherche.
13. L'annuaire
de Yahoo! France est-il un sous-ensemble de celui de
Yahoo! International ?
Non, les deux bases sont totalement
dissociées. Le contenu de Yahoo! France (http://fr.dir.yahoo.com/directory/)
n'a rien à voir avec celui de Yahoo! International
(http://dir.yahoo.com/).
Les recherches doivent s'effectuer avec des mots en
français sur Yahoo! France et des mots en anglais
sur Yahoo! international.
14. Est-ce
qu'avec un annuaire et un moteur, je peux avoir la réponse
à toutes mes questions ?
Non, pour plusieurs raisons :
aucun annuaire et aucun moteur de recherche n'est exhaustif
quant à la masse d'information présente
sur le Web, loin de là. D'autre part, il existe
de nombreux autres outils de recherche, différents
des annuaires de type Yahoo! ou des moteurs de recherche
de type Google : moteurs de recherche spécifiques
et thématiques, annuaires d'adresses E-mail,
moteurs géographiques, etc.
Disons que les annuaires et les moteurs de recherche
répondent à 80% des recherches classiques.
Les autres outils cités traitent les 20% restants.
15. Les
index des moteurs de recherche sont-ils tous identiques ?
Non, ils n'ont rien à voir
les uns avec les autres. Google possède un index
qui lui est propre, Yahoo! Search idem, etc. Mais les
pages de Yahoo! Search ne sont pas obligatoirement comprises
dans celles de Google, bien qu'il y ait un certain recouvrement.
Le meilleur des moteurs ne couvre, de toutes façons,
qu'une faible partie des pages Web disponibles dans
le monde entier...
16. Faut-il
utiliser plusieurs moteurs de recherche à la
suite ?
En d'autres termes, faut-il utiliser
Google, puis Yahoo! Search, puis MSN Search, etc ? Oui,
si vous avez beaucoup de temps devant vous. En pratique,
la bonne connaissance d'un annuaire et d'un moteur de
recherche et surtout leur utilisation de manière
appropriée et efficace suffit dans bon nombre
de cas.
17. Faut-il
se former à la recherche d'information ?
Honnêtement, je pense que
oui, car cela devient un véritable métier
à part entière.
18. Existe-t-il
des méthodologies pour rechercher l'information
sur l'Internet ?
Oui, tous les organismes de formation
sérieux qui traitent du domaine ont mis en place
des méthodologies de recherche générales
et plus précises pour certains cas (voir également
le point 24 de cette FAQ ;-))
19. J'ai
demandé un mot sur un moteur, et la page proposée
ne le contient pas . Pourquoi ?
Il peut y avoir plusieurs explications,
mais la plus vraisemblable est que ce mot se trouvait
dans la page lorsque celle-ci a été sauvegardée
par le robot logiciel du moteur. Puis elle a été
modifiée et le mot a disparu entre-temps de son
contenu, le jour où vous avez effectué
l'interrogation.
20. Comment
en savoir plus sur les moteurs de recherche et les annuaires ?
Euh, n'oubliez pas que vous êtes
sur un site qui ne parle que de ça ;-). Un petit
saut à la page
d'accueil devrait vous renseigner sur les autres
informations disponibles dans ces pages. Si le site
Abondance n'a pas su répondre à vos questions
(croyez bien que j'en suis désolé :-(),
vous avez d'autres sources
disponibles sur le sujet.
21. Existe-t-il
des forums de discussion parlant du sujet ?
En français, je n'en connais
pas, à part fr.network.internet qui est
très général.
En anglais, alt.internet.search (mais il en existe
de nombreux autres) est à votre disposition.
Sinon, ceux
du site Abondance sont à votre disposition
! Vous
trouverez également une réponse à
cette questions dans notre rubrique "Questions
du mois".
22. Existe-t-il
des listes de diffusion parlant du sujet ?
Il existe une excellente liste
de diffusion francophone parlant des moteurs de recherche,
MotRech. Pour en savoir plus, allez à
l'adresse http://motrech.free.fr/.
La liste Veille
évoque également souvent le sujet de la
recherche d'information.
23. Comment
me tenir au courant de l'actualité du domaine ?
Alors,
là, vous le faites exprès :-))
Le site Abondance vous propose une lettre
d'information hebdomadaire gratuite sur l'actualité
des moteurs de recherche et une lettre
payante (pour 65 euros HT par an) et mensuelle ,
spécifiquement sur la promotion de site Web.
Mais il existe d'autres sources
d'information sur le sujet.
24. Existe-t-il
un bon livre sur le sujet ;-) ?
Franchement,
vous me l'ôtez de la bouche. :-)
Une bibliographie francophone
sur ce thème est disponible sur ce site.