|
PONDÉRATION COMPARATIVE DE L'APPARITION
D'UNE SÉLECTION DE MOTS DANS LES PAGES W3 DE L'INTERNET
Une étude par Daniel
Pimienta, Fondation de Réseaux et Developpement (FUNREDES)
|
INTRODUCTION
Ce qui suit est un exercise sans prétention, une première
approximation pour essayer de quantifier la présence de la France dans l'Internet, tant
sur le plan de la langue que celui de la culture.
C'est également une tentative de vérification de la
réalité d'une "préférence culturelle" sur l'Internet envers les
Nord-américains.
La méthode consiste à compter, à l'aide des outils de
recherches par mots-clefs, le nombre de citations de tel mot ou tel nom dans les
"ressources d'information" établies avec le support "World Wide Web"
(ou WWW, ou Web, ou W3).
Étant donné le lieu du séminaire, nous avons intégré
dans cette étude les critères de l'hispanité et parfois des références à la
République Dominicaine.
Le comptage est effectué à partir des ressources stockées
en format Web (HTML) et la recherche est faite avec un outil très puissant de recherche
par mots-clefs. Il s'agit de ALTA VISTA, qui est offert en accès libre par Digital
Equipment Corp.
Nous recherchons des mots rédigés sans accent et choisis
pour éviter les "collisions sémantiques".
Les cas où d'autres significations perturbent le résultat
sont signalés par le format italique.
Les mots-clefs donnant des résultats très éloignés de la
moyenne sont signalés par le format gras.
Les mots-clefs sont sélectionnés en fonction de critères
de forte signification culturelle ou linguistique, et selon une variété de thèmes.
table de l'échantillon de mots
Ces résultats sont à prendre seulement comme un ordre de
grandeur ; ils ne peuvent pas être considérés comme statistiquement fiables.
Avec prudence, il est donc possible d'estimer que l'anglais
est, en moyenne, 20 fois plus utilisé que le français sur l'Internet; et l'espagnol deux
à trois fois moins que le français.
La variance est forte, et il est possible de voir quelques
cas où le français s'approche de l'anglais (et même un cas où il l'emporte largement
!).
Ces cas sont ceux où, culturellement, le français est plus
fort.
Les thèmes où le français semble dans une position
sensiblement meilleure que la moyenne sont :
- Francophonie (qui s'en étonnera ?)
- Gastronomie, vins, fromages et parfums, bien sûr... mais non
les recettes de cuisine !
Les thèmes où le français semble dans une position
meilleure que la moyenne sont :
- sciences et techniques (bien !)
Les thèmes où le français est dans la position la plus
difficile sont :
- sexe (la reconversion du minitel rose reste à faire !)
- affaires (attention danger !)
- autres langues. Surprise ! Les internautes de langue anglaise
nous donnent des leçons de solidarité avec les autres langues et cultures...
À partir de ces données, et en recoupant avec d'autres
facteurs,
il est possible d'estimer
grossièrement que entre 60% et 80% des "ressources" Internet sont en anglais,
et entre 3% et 4% en français. |
CONCLUSION
En conclusion, le problème de la présence de la langue
française est réel, mais la magnitude est inférieure à certains chiffres avancés (90%
pour l'anglais). Dans tous les cas, la solution est simple et à la portée de la main:
utilisez vos claviers et transformez-vous de spectateurs en acteurs...
Pour renverser la tendance, il faut que les francophones (à
l'instar des autres langues et cultures) construisent leurs propres ressources
d'information qui refléteront leur langue et leurs cultures.
Une transition annonciatrice de la prochaine surprise de
cette étude :
Paris apparaît dans les pages de Webs seulement deux fois moins que New-York !
Le "hit parade" (oh pardon, le
classement...) qui suit vous éclairera sur les raisons.
|