La présence de la langue française au sein des serveurs des Nations Unies

Par Florent Breuil, Chargé de mission environnement,
École nationale supérieure des mines de Saint-Étienne,

Équipe Agora 21.

La présence affichée par les moteurs de recherche

Il est admis que l'exhaustivité des moteurs de recherche est d'environ 30%. Cela explique en partie la difficulté que rencontre tout utilisateur pour trouver l'information pertinente. Une des solutions consiste à utiliser systématiquement plusieurs moteurs de recherche pour une même requête en supposant que ce qui n'est pas connu de l'un d'eux l'est par un autre. Cela augmente bien entendu les temps de recherche et de dépouillement des données.

Trouver de l'information francophone ajoute encore à la difficulté lorsque l'on recherche au niveau international.

Nous avons expérimenté la démarche d'un utilisateur moyen qui rechercherait des documents en langue française sur les serveurs des Nations Unies en rapport avec l'environnement.

La première étape est de trouver les serveurs eux-mêmes et ensuite de rechercher les documents français contenus dans ces serveurs.

Nous avons interrogé plusieurs moteurs de recherche (Altavista, Excite et Lycos) afin de déterminer s'ils prenaient en compte les documents francophones. Ces moteurs ont été choisis car ils fournissent une option qui permet de spécifier la langue dans laquelle l'utilisateur attend une réponse.

Nous avons ainsi identifié les sites et demandé à chaque moteur la totalité des références qu'il connaissait en langue anglaise et en langue française.

Les résultats montrent une faible présence de la langue française au sein de ces serveurs. En effet, la visite de ces sites confirme qu'ils proposent peu de pages francophones.

Sur 16 sites :

En conclusion : malgré une marge d'erreur importante, la présence du français dans les serveurs à vocation environnementale des Nations Unies est faible à travers les moteurs de recherche. Cela reflète certainement une présence faible du français, sans pouvoir la quantifier exactement.

Une comparaison des résultats obtenus dans un intervalle de un an sur 5 sites du PNUE avec le moteur Altavista, ne permet pas de montrer une évolution significative de la présence du français au sein de ses serveurs.

Il reste donc relativement difficile de trouver les documents de langue française en utilisant les moteurs de recherche.
 
 

Etude d'un cas particulier : le serveur du Secrétariat de la Convention-Cadre sur les Changements Climatiques

Le résultat des moteurs de recherche se situe entre 0 et 3 %.

La structure du site est conçue en langue anglaise, et seulement 5 documents textuels au format HTML ont été trouvés, ce qui est inférieur aux résultats de Altavista et de Excite (respectivement 6 et 8 documents trouvés). En regardant de plus près, 5 des références de ces moteurs sont erronées (l'adresse des fichiers ayant changé).

En revanche, ce serveur contient 333 documents textuels au format PDF en langue française. En effet, la navigation se fait en anglais et lorsque le serveur propose des documents à télécharger, ils sont stockés au format PDF et en plusieurs langues. Or, les moteurs de recherche prennent en compte uniquement les documents au format HTML.

Si nous tentons d'évaluer la présence des documents en langue française pour ce site (globalement et non uniquement par rapport aux documents anglophones), nous obtenons, tous formats confondus, 338 documents en français pour environ 1800 documents contenus ce qui représente un score de 19 %.
 
 

En conclusion : la réponse des moteurs de recherche sous-estime largement la présence de la langue française au sein de ce serveur. Si l'utilisateur d'Internet averti a la curiosité de visiter de façon approfondie le site, il trouve finalement de nombreux documents pouvant l'intéresser, en revanche, un débutant ou un utilisateur peu expérimenté risque de se contenter de la réponse des moteurs de recherche qui lui donnent uniquement 3 réponses valides.

.
Site du Secrétariat de la Convention-Cadre sur les Changements Climatiques
 
Représentativité du français définie par les moteurs de recherche
Moteur de recherche  références anglaises références françaises  Pourcentage Remarque
Excite
315
8
2,54%
5 liens morts
Lycos
123
0
0,00%
Altavista
718
6
0,84%
5 liens morts

 
Représentativité définie par une visite approfondie
Type de documents références globales références françaises  Pourcentage
HTML
831
5
0,60%
PDF
964
333
34,54%
TOTAL
1795
338
18,83%

Conclusion

La traduction des documents internationaux en langue française et leur publication sur le Web sont nécessaires pour permettre l'accès à l'information et la participation de la communauté de langue française aux débats internationaux sur le développement durable. Les versions françaises des documents existent le plus souvent au sein des organisations internationales et sont disponibles sous forme papier.

Dans certains cas elles peuvent être obtenues sous forme de fichier envoyé à la demande par courrier électronique. Si les fichiers sont accessibles sur le Web ils peuvent être difficiles d'accès, les arborescences qui pourraient y conduire sont presque exclusivement en langue anglaise. Enfin les moteurs de recherche internationaux n'y donnent pas souvent accès.

Une profonde réorganisation des sites internationaux serait nécessaire pour assurer un accès réellement multilingue et un référencement correct par les moteurs de recherche internationaux. Une autre solution consisterait à mettre au point une procédure et/ou un moteur de recherche unique de langue française qui donne l'accès à l'ensemble des documents internationaux. Les sites internationaux pourraient avoir une procédure simple de référencement (méta-information) sans avoir besoin de gérer les arborescences en langue française.

Accueil Retour Mel
Réalisation Agora 21 : ARMINES, Ecole Nationale Supérieure des Mines de Saint Etienne © 1999.
Webmaster : agora21@emse.fr.