Olivier
Andrieu : Bonjour et merci de bien vouloir répondre
à ces quelques questions pour le site Abondance.
En guise d'introduction, pouvez-vous vous présenter
en quelques mots ?
Cheickne Keita : Je m'appelle Cheickne Keita, j'ai
une formation d'IUP Miage (Méthodes informatiques
appliquées à la gestion). Plus une licence
d'économie et gestion. Mon cursus : Développement
de logiciels de gestion avant d'entrer chez Yahoo!.
Pouvez-vous présenter
Yahoo! France en quelques chiffres ?
Nombre
de netsurfeurs visitant les sites proposés
Huit
netsurfeurs employés à temps plein
ont la charge de la base de données de
Yahoo! France : ils référencent
des sites et organisent les catégories.
Nombre
moyen de soumissions de sites reçues
chaque jour
Nous
recevons plus de 600 demandes par jour.
Ratio
moyen sites acceptés / sites soumis
Nous
refusons environ 40 % des sites. La très
grande majorité des sites refusés
vient de sites qui ne sont pas en français,
qui ont été soumis/re-soumis plusieurs
fois ou qui sont en construction.
Pourcentages
d'évolution des demandes d'inscription
depuis la création de Yahoo! France
Depuis
la création de Yahoo! France : Environ
250% d'augmentation annuelle.
Pouvez-vous décrire
le processus de traitement par Yahoo! France d'une demande
d'inscription dans votre annuaire ?
Le surfeur visite le site. Cela lui prend entre une
et dix minutes, selon le type de site, parfois même
quelques dizaines de minutes. Il se fait ainsi une vision
d'ensemble du site qui lui permettra de le classer rapidement
en respectant les règles d'indexation habituelles.
Toutes les agences immobilières sont classées
de la même façon, par exemple.
La première étape est de donner un titre
au site : ce titre est celui qui est visible sur la
page d'accueil du site, pas forcément celui qu'aura
soumis l'internaute. Dans le cas d'une société
ou d'une association, le titre est cependant obligatoirement
la raison sociale de la structure. Puis, le surfeur
détermine la ou les catégories pertinentes
où classer le site : dans le cas de sociétés
ou d'organismes, le critère géographique
ayant son importance, les sites sont d'abord classés
dans leur ville, avant d'être "lié" dans
une autre catégorie indiquant son domaine d'activité.
Un exemple simple : le site de la société
Biomérieux,
à l'adresse http://www.biomerieux.fr/
france/ bioweb-fr.html, sera classé
d'abord dans sa ville, c'est-à-dire dans la catégorie
http://www.yahoo.fr/ Exploration_geographique/
Pays/ France/ Regions /Rhone_Alpes/ Departements/ Rhone__69_/
Villes/ Marcy_l_Etoile/ puis lié dans
la catégorie (dans ce cas le symbole @
apparaitra au niveau de la catégorie liée)
expliquant ce qu'elle fait, soit : http://www.yahoo.fr/
Commerce_et_economie/ Societes/ Sante/ Biomedecine/
Le commentaire, rédigé par le surfeur,
doit être le plus objectif et informatif possible,
mais pas trop long. En l'occurrence : "Groupe
international de diagnostic in vitro : réactifs
et instruments pour analyses médicales et contrôles
microbiologiques des produits agro-alimentaires, cosmétiques
et pharmaceutiques."
On utilise pas mal de "trucs" pour rendre la base intelligente
: certaines catégories peuvent par exemple être
retrouvées en tapant un mot-clé qui pourtant
n'apparaît pas dans le nom de la catégorie.
Exemple : en tapant "down", l'internaute obtiendra la
catégorie "Trisomie 21" (http://www.yahoo.fr/
Sante/Maladies_et_pathologies/ Maladies_et_affections_genetiques/
Trisomie_21/), parce que les surfeurs ont
associé ce mot-clé à cette catégorie
(la trisomie 21 s'appelle aussi syndrome de Down). On
n'associe en revanche jamais ce genre de mots-clés
cachés à des sites, uniquement à
des catégories, pour n'avantager aucun site par
rapport à un autre.
Quels sont les délais
actuels entre la soumission et la prise en compte d'un
site ?
Ce délai est variable, selon le type de site.
Nous essayons, par exemple, de réagir rapidement
à l'actualité : il serait impardonnable
de "rater" le site du festival de Cannes si celui-ci
nous est soumis deux jours avant le début de
la compétition... Pour un site "normal", patienter
deux, voire trois semaines entre la soumission du site
et sa visite par le netsurfeur est tout à fait
habituel. Au delà, on peut commencer à
ruer dans les brancards ;-)
Une question m'est, bien entendu,
posée quasiment chaque jour : quels sont vos
critères d'acceptation ou de refus d'un site
?
Yahoo! ne référence pas tout ce qu'on
lui soumet. Les principaux critères de refus
sont simples : si le site ne présente pas de
contenu en français, on ne regarde pas plus loin.
On oriente dans ce cas l'internaute vers le Yahoo! le
plus adapté. Par exemple un site en italien (cas
fréquent) soumis à Yahoo! France sera
rejeté, mais l'internaute recevra un mail lui
indiquant qu'il peut le soumettre à l'équipe
de surfeurs de Yahoo! Italia.
Le deuxième critère de refus est tout
aussi clair et objectif : c'est la loi. La conformité
à la législation française est
un critère de base pour les surfeurs de Yahoo!
: dans certains cas (sites nazis, pédophiles,
ou faisant l'apologie des drogues) c'est évident,
et nous appelons même l'hébergeur du site
pour l'informer de l'existence sur son serveur de pages
négationnistes, par exemple. Dans d'autres cas,
la frontière est plus floue entre ce qui est
autorisé ou pas : le cas du marketing multiniveaux
est un exemple parlant.
Enfin, le dernier critère de refus d'un site
est un tout petit peu plus "subjectif" : si nous estimons
que le contenu n'est pas suffisant (images cassées,
liens morts) ou qu'il n'apporte rien de nouveau à
ce qu'on a déjà référencé
(par exemple, une énième page sur la série
"Friends" sans réelle nouveauté), nous
le rejetons.
Après avoir soumis un site à Yahoo!, l'internaute
est averti que nous éditons un guide Web, pas
un moteur : nous nous réservons, et c'est important,
le droit de refuser
un site.
Pourquoi l'internaute n'est-il
pas tenu au courant par mail du refus d'un site ?
Comme je viens de le dire, il l'est, normalement. Nous
envoyons des courriers types après avoir traité
chaque site. Ces courriers couvrent à peu près
tous les cas de figure.
Lors de la demande d'inscription,
le fait d'avoir un nom de domaine propre (par exemple
www.mon_nom.com) donne-t-il un avantage par rapport
à une adresse chez un hébergeur (www.monhebergeur.com/entreprises/mon_nom/)
?
Absolument pas. D'abord parce que nous réservons
le même traitement à tous les sites. Et
puis, par expérience, nous savons qu'il est de
plus en plus facile (et grisant) de se procurer un nom
de domaine propre, et que beaucoup des très bons
sites que nous référençons ont
une adresse "composée".
Que regardez-vous en priorité
sur un site ? Regardez-vous le code HTML de la page
d'accueil pour y déceler d'éventuelles
tentatives de spam à l'encontre des moteurs de
recherche (balises Meta "frauduleuses" par exemple)
?
Nous laissons les moteurs se débrouiller avec
les balises META ;-). Yahoo! ne prend pas en compte
le code HTML des pages, seulement le résultat
visible sur le navigateur. Notre priorité, c'est
l'utilisateur. Le facteur humain nous permet justement
de juger les sites uniquement en fonction de ce qu'ils
affichent, ce qu'un moteur automatique ne peut évidemment
pas faire : il classe des sites en fonction des chaînes
de caractères qu'il rencontre.
En combien de temps, en moyenne,
un site est-il "analysé" ?
Avec l'expérience, assez rapidement. Nous prenons
plus de temps à organiser la base de données
(créer de nouvelles catégories, réfléchir
à leur organisation) qu'à ajouter les
sites proprement dits. De plus, à Yahoo! France,
un site est au moins visité deux fois en vingt-quatre
heures : après la première visite, le
netsurfeur ajoute le site dans la base, rédige
son commentaire, et le lendemain un autre surfeur va
parcourir la base de données et vérifier
que tous les sites ajoutés la veille par ses
collègues ont été correctement
référencés. Ce qui limite le risque
d'erreurs.
Que conseilleriez-vous à
un webmaster pour être plus facilement "éligible"
sur Yahoo! France ?
Outre les critères de base (conformité
à la loi et contenu en français), je lui
conseillerais de s'assurer que son site présente
suffisamment d'information pour ne pas décevoir
les visiteurs éventuels. Nous nous identifions
à l'internaute lambda effectuant une recherche
sur Yahoo! : si le contenu du site est pauvre, mal présenté,
ou recopié sur d'autres sites, on passe au site
suivant...
Considérez-vous qu'aujourd'hui,
vous êtes la cible de spam ? Ou plutôt,
quelle est votre définition du spam dans le cas
d'un annuaire ? Soumettre plusieurs fois un site (en
cas de refus avec 15 jours de d'intervalle entre deux
soumissions) est-il considéré pour vous
comme du spam ?
Non, évidemment. En fait nous comprenons aisément
que certains sites soient soumis plusieurs fois : les
gens s'imaginent souvent qu'après avoir fini
de remplir le formulaire, ils pourront effectuer une
recherche sur Yahoo! et que leur site apparaîtra
dans les résultats, en première place,
évidemment ;-)
Ceux-là, nous les reconnaissons et les excusons.
En revanche, le spam existe pour nous, oui : soumettre
le même site trente fois par jour ne sert à
rien, ça énerve même plutôt
les surfeurs, qui n'ont pas de temps à perdre
avec toutes les demandes qu'ils reçoivent. Une
autre technique est de soumettre le même site
plusieurs fois sous deux URL différentes. Pas
très agréable d'être pris pour un
ordinateur bête comme ses pieds !
Refusez-vous systématiquement
certains sites "extrémistes", porno ou autres
? Lesquels ? Le cas se présente-t-il souvent
?
Comme je l'ai dit plus haut, on refuse tout ce qui n'est
pas légal. Les sites pornos ne nous posent aucun
problème de conscience. En revanche leur présentation
nous désole souvent... ;-)
Ce qu'on va refuser dans ce domaine précis, ce
sera les sites pédophiles, évidemment.
On ne se demande pas si une fille sur une photo a plutôt
16 ou 18 ans. Dans le doute, on refuse.
Comment percevez-vous le métier
de "référenceur professionnel" ? Pensez-vous
qu'une "charte de qualité" ou un "agréement"
serait une bonne chose pour vous... et pour les référenceurs
?
Soumettre un site à Yahoo! n'est pas compliqué,
contrairement à ce qui est dit à droite
et à gauche. Simplement, cela peut paraître
pénible de lire toutes les explications qu'on
propose sur le site (par exemple ici : http://www.yahoo.fr/aide/chapitres/10/1.html),
et les référenceurs professionnels profitent
de cet état de fait. Il arrive très souvent
qu'on reçoive un mail ou un coup de fil d'un
référenceur "professionnel" (faisant payer
des gens pour référencer de manière
"optimale" leur site dans Yahoo!) et nous demandant
comment on travaille, par exemple pourquoi Yahoo! ne
prend pas "correctement" en compte les balises META.
Ca, c'est scandaleux.
Le référencement sur Yahoo! est gratuit,
et sur la grande majorité des autres moteurs
et annuaires aussi. Alors le prix d'un référencement
"professionnel" nous choque. De plus le référencement
par ce biais est très souvent garanti un peu
vite : Yahoo! refuse des sites, tout le monde le sait,
et on ne peut pas y soumettre n'importe quoi.
Vérifiez-vous périodiquement
les adresses de votre base, afin d'éviter les
"erreurs 404" ?
Evidemment. Mais les erreurs 404 sont inévitables
dans une base de données de sites Web.
Nous faisons de notre mieux pour les déceler
(avec quelques outils maison) et pour les traiter le
plus rapidement possible : destruction de l'entrée
dans la base, ou bien recherche de la nouvelle adresse
si elle existe. Nombre de nos utilisateurs nous aident
aussi dans cette tâche et nous envoient les erreurs
404 qu'ils trouvent. C'est typiquement le genre de mails
qu'on va traiter en priorité ;-)
Pour terminer, puisque vous
êtes certainement les mieux placés pour
celà, comment jugez-vous la qualité des
sites Web francophones actuels ? Plutôt en baisse
ou en hausse ?
Le Web est un support révolutionnaire à
beaucoup d'égards : il permet à tout le
monde de s'exprimer, à un coût dérisoire.
Nous, on est toujours enthousiasmés par les très
bons sites qu'on croise, pas forcément les plus
techniques (de ce côté-là, bien
sûr, on voit des choses très très
belles, de plus en plus, mais ça ressemble tellement
à des spots de pub, souvent...). Je ne sais pas
si la qualité globale est en hausse. Grâce
à certaines technologies, RealAudio, Shockwave,
on peut faire de très jolis sites. Reste à
ne pas oublier le contenu, régulièrement
délaissé. A Yahoo! nous sommes très
amateurs des sites curieux, fouineurs, bourrés
d'infos, inventifs. On ne rigole pas tous les jours.
Parfois on s'amuse de voir un plombier faire un site
en trois langues pour "envahir le marché mondial".
L'année 98 a été belle, la preuve
en est notre sélection des sites de l'année
: une trentaine de pépites disponibles sur notre
site à l'adresse http://www.yahoo.fr/selection/centieme/
Je peux vous garantir que 1999 sera un meilleur cru.
C'est prometteur !
Merci Cheickne Keita :-)
(et merci également à Clotilde Drouot-L'hermine
et Clotilde de Mersan ;-))