|
Interview de Randolph Hock, auteur de "The
Extreme Searcher's Guide to Web Search Engines"
Randolph Hock est l'un des meilleurs spécialistes
de la recherche d'information sur le Web. Il est l'auteur
du best-seller "The
Extreme Searcher's Guide to Web Search Engines".
Il a formé de nombreux professionnels (éducation,
gouvernement, entreprises...) à la recherche
en ligne et sur Internet. Durant sa carrière,
il a occupé différentes fonctions de
responsable et de formateur pour DIALOG et Knight-Ridder
Information Services. Il a travaillé en tant
que bibliothécaire de référence
au M.I.T. et à l'Université de Pennsylvanie.
Il est professeur adjoint à l'Université
du Maryland. Il répond à nos questions
(interview réalisé en collaboration
avec Thibaut Deshayes
du site Asktibbs)
Pouvez-vous vous présenter
à la communauté Internet française
?
D'abord, je dois dire que je suis honoré de
participer à cette interview. En plus d'avoir
apprécié les beautés de la France
et de sa culture pendant plusieurs séjours,
j'ai un grand respect pour le rôle que la France
a pris dans le développement de l'Internet.
Le Minitel, en particulier, a donné tôt
au monde une vision des possibilités des moyens
de communication. J'ai été impliqué
dans les services en ligne depuis le début
des années 70, quand je travaillais en tant
que bibliothécaire de référence
à l'université.
Vers la fin des années 70 je me suis éloigné
du monde de l'information pendant quelques années
pour obtenir un doctorat en religion comparative.
Excepté mon premier emploi en tant que professeur
de chimie au lycée, j'ai travaillé la
majeure partie de ma carrière pour les services
d'information DIALOG,
au début comme formateur, et ensuite, comme
responsable des services régionnaux.
En quittant DIALOG
en 1997, je me suis spécialisé en animant
des conférences personnalisées de recherche
sur internet, au travers de ma société
"Online
Strategies". J'organise des séminaires
pour toute sorte d'organisations, de sociétés,
d'associations, d'organismes gouvernementaux, de bibliothèques,
et d'écoles. Comme vous le savez, j'écris
et en ce moment je travaille à la phase finale
de la deuxième édition de mon livre
"The
Extreme Searcher's Guide to Web Search Engines".
Nous espérons qu'elle sera disponible en avril.
Comment vous êtes-vous
intéressé aux moteurs de recherche ?
Cela remonte principalement à mon intérêt
pour la recherche documentaire qui m'a mené
à une carrière de bibliothécaire.
Mes nombreuses années passées chez DIALOG
démontrent, naturellement, un intérêt
constant pour des "outils de recherche" dans un sens
plus large. Quand je me suis mis à faire de
la formation Internet, les moteurs de recherche étaient,
et sont toujours, un des sujets les plus populaires.
Pour avoir travaillé pour des services de recherche
commerciaux, je trouve les similitudes et les différences
fascinantes. Je suis fasciné par les énormes
possibilités que les moteurs de recherche proposent
aux utilisateurs occasionnels, aux particuliers et
aux chercheurs professionnels.
Quel type d'outils utilisez-vous
la plupart du temps lors de vos recherches sur le
Web? moteurs ou répertoires de recherche?
J'ai tendance à utiliser des moteurs de recherche
plus fréquemment. Avec l'amélioration
constante de leur pertinence (particulièrement
les résultats basés sur la popularité),
la sélectivité fournie par les répertoires
est devenue moins importante.
En outre, certains moteurs de recherche me permettent
d'avoir les avantages des deux types d'outils. Comme
vous le savez, Google
incorpore automatiquement des sites de l'Open
Directory dans ses résultats, et AltaVista
fournit des résultats tirés de répertoire
sous sa rubrique "reviewed sites"
Que pensez-vous des métamoteurs
?
Je pense qu'ils sont utiles quand vous devez faire
une recherche approfondie, mais seulement après
avoir recherché dans au moins deux des plus
grands moteurs de recherche. Beaucoup de personnes
ne réalisent pas que la plupart des métamoteurs,
ont trois inconvénients importants. Ils ne
renvoient pas toutes les pages réellement indéxées
par les moteurs (souvent les dix premiers), ils ne
couvrent pas tous les grands moteurs de recherche,
et ils ne permettent pas une utilisation efficace
de la syntaxe de recherche.
En ce moment les deux métamoteurs, qui semblent
offrir le meilleur compromis sont Ixquick
(qui a une version française), et Dogpile.
Quel est votre outil de recherche
préféré?
Ah, la question la plus difficile de toutes ! je peux
honnêtement dire que je n'ai pas de moteurs
favori. Les trois que j'utilise le plus sont Northernlight,
AltaVista,
et Google,
pas nécessairement dans cet ordre. Pour des
recherches rapides et faciles j'utilise Google,
en raison de sa pertinence (classement basé
sur la popularité) et de la taille de son index.
Pour des recherches plus complexes j'utilise Northernlight
et AltaVista.
Chacun d'eux a des options qui peuvent faire une grande
différence dans la qualité des résultats.
La "Special collection of journals" de Northernlight
propose des documents au delà des ressources
ordinaires du Web et ses "Custom search folders" fournissent
de bonnes possibilités d'affiner une recherche.
AltaVista
possède un large index avec une bonne possibilité
de recherche par champs, et d'autres options intéressantes
comme la recherche d'image. AltaVista
et Google
proposent de bonnes possibilités de recherche
par langue.
Selon vous quel est l'avenir
des outils de recherche?
J'ai juste changé d'avis à ce sujet.
C'est une question difficile. Pour les moteurs de
recherche, dans un avenir proche (les deux prochaines
années), nous allons assiter à une combinaison
de quelques nouveaux concepts et beaucoup d'idées
copiées. Si un moteur de recherche découvre
un principe qui marche, attendez-vous à ce
qu'au moins un ou deux autres moteurs reprennent l'idée.
Ce n'est cependant pas une mauvaise chose. Le succès
de Google
avec son principe de classement axé sur la
popularité a causé la reprise de cette
approche par d'autres moteurs.
La bataille à long terme se situe entre simplicité
et perfectionnement. Google
est devenu populaire grace au compromis entre son
extrême simplicité d'utilisation et la
complexité de son système de classement
de résultats. Les outils qui pourront fournir
un bon équilibre réussiront. Un des
dangers réside dans "la dictature de la majorité".
Il y a un risque que des outils destinés aux
"chercheur professionel" ne soient pas assez populaire
pour être rentables. D' autre part, comme l'Internet
devient de plus en plus incontournable dans la vie
quotidienne, le nombre de chercheurs ayant un usage
professionel augmentera. Par conséquent, je
pense que nous verrons des moteurs continuellement
améliorés comme Northernlight,
qui s'adressent aux professionels de la recherche.
Un des domaines où nous avons vu un compromis
judicieux entre simplicité et perfectionnement,
c'est la manière dont les outils de recherche
ont intégrés différents services
pour le chercheur. J'ai déjà mentionné
la présence de sites tirés d'annuaire
dans les résultats des moteurs de recherche.
Inversement, pour l'utilisateur qui observe soigneusement,
Yahoo
propose un lien qui mène non seulement aux
résultats de l'annuaire mais également
des liens qui mènent aux résultats de
Google,
à la recherche dans les actualités,
et à d'autres ressources.
D'une manière générale, je pense
que nous assisterons à un effort continu des
outils de recherche pour ce compromis entre simplicité
et perfectionnement, à l'amélioration
de la pertinence, à l'intégration efficace
de différents services et sources de données
pour un même outil.
Que pensez-vous des limites
des moteurs de recherche par rapport à la croissance
exponentielle de l'Internet ?
J'ai cessé d'être pessimiste à
ce sujet. Malgré ce que quelques études
ont montré à propos de l'infime couverture
du web par les outils de recherche, je pense qu'ils
vont utiliser des technologies de plus en plus sophistiquées
pour nous aider à trouver le contenu véritablement
significatif. Il y a une limite pratique au nombre
de pages web utiles que six milliards de personnes
peuvent produire.
Quelle est la technologie
la plus innovante et la plus intéressante concernant
les outils de recherche (indexation, rang, pertinence...)
?
Je pense que la chose la plus intéressante
concerne les critères de classement et de pertinence.
Le principe de popularité (comme pour Google)
marche très bien pour de nombreuses recherches.
Cependant, un compromis avec des techniques de classement
basées sur l'analyse du contenu offrirait encore
de meilleurs résultats.
Pensez-vous que le référencement
payant va devenir de plus en plus courant ?
Je pense que le référencement payant
va devenir de plus en plus courant, s'il s'opère
d'une manière acceptable pour l'utilisateur.
L'idée de payer pour améliorer la visibilité
d'un site rend les utilisateurs très soupçonneux
une fois qu'ils réalisent ce qui se produit.
Pour les annuaires et les moteurs de recherche, si
les sites qui paient leur classement occultent d'autres
sites, les utilisateurs s'en apercevront et utiliseront
d'autres outils. AltaVista
l'a essayé par le passé et a clairement
séparé ses résultats payants
des autres. Les utilisateurs ont rapidement réagi,
en grande partie parce que les résultats payants
ont eu une place trop importante. AltaVista
l'utilise encore, mais cette fois met les résultats
"payants" en bas de la page. Ceci peut fonctionner.
Que pensez-vous du positionnement
dans les moteurs de recherche ? Est-ce encore valable?
Ici nous touchons un domaine où je ne suis
pas qualifié pour répondre de manière
définitive. N'importe quel producteur de site
Web devrait prêter attention à quelques
principes de base pour que ses pages ne soient pas
ignorées. J'espère que dans la plupart
des cas les algorithmes de classement pourront trier
le contenu vraiment significatif de manière
efficace. Ceci est peut être utopique, mais
je constate que les moteurs de recherche dans la plupart
des cas font preuve d'efficacité en évitant
les pages "truquées" et en privilégiant
les pages présentant du contenu.
|