
Les résultats sont obtenus en conservant la méthodologie suivie à partir de 1998. D'abord, une sélection de 57 termes par langue est faite, chacun de ces termes comportant des variantes (orthographiques, selon la présence ou non de signes diacritiques, mais aussi synonymiques, dialectales ou morphosyntaxiques) et ayant une signification et une portée équivalente dans les langues étudiées (détails des critères linguistiques : 4.2 et annexe 7). Ensuite, il s'agit d'analyser et de comparer les résultats pour en déduire, par la méthode statistique, des pourcentages de présence pour chacune des langues. Pour chaque terme, le rapport des langues latines à l'anglais est utilisé comme une variable aléatoire et les techniques de la statistique sont appliquées en prenant comme hypothèse une distribution mathématique courante de cette variable aléatoire (la courbe de Gauss dite aussi distribution "normale").
Les résultats présentés ci-dessous
ont été obtenus en faisant la synthèse des scores relevés sur le moteur
de recherche qui ont satisfait aux critères de sélection décrits dans l'annexe
4. Les mesures prises en compte dans cette étude ont été effectuées
entre ao�t 2000 et juin 2001.
|
WWW |
|
| ESPAGNOL |
10,95% |
| FRANÇAIS |
8,86% |
| ITALIEN |
5,88% |
| PORTUGAIS |
5,40% |
| ROUMAIN |
0,32% |
| ALLEMAND |
> 13,42% (estimé)1 |
| Si ANGLAIS = | 65,00% | 60,00% | 55,00% | 52,00% | 50,00% | 45,00% | 40,00% |
| alors ESPAGNOL = | 7,12% | 6,57% | 6,02% | 5,69% | 5,48% | 4,93% | 4,38% |
| alors FRANÇAIS = | 5,76% | 5,32% | 4,87% | 4,61% | 4,43% | 3,99% | 3,54% |
| alors ITALIEN = | 3,82% | 3,53% | 3,23% | 3,06% | 2,94% | 2,65% | 2,35% |
| alors PORTUGAIS = | 3,51% | 3,24% | 2,97% | 2,81% | 2,70% | 2,43% | 2,16% |
| alors ROUMAIN = | 0,21% | 0,19% | 0,18% | 0,17% | 0,16% | 0,14% | 0,13% |
| alors ALLEMAND2 = | 8,71% | 8,04% | 7,37% | 6,30% | 6,97% | 6,70% | 5,37% |
| Il restera donc un espace pour les autres langues = | 5,83% | 13,10% | 20,35% | 24,96% | 27,59% | 34,83% | 42,07% |
Ce tableau donne une idée plus précise du poids absolu des langues étudiées
par rapport à l'ensemble des pages présentes sur la Toile. Un des indicateurs
les plus significatifs est celui de l'espace disponible pour les langues restantes,
qui nous permet de sélectionner l'hypothèse d'une présence absolue de l'anglais
avoisinant les 52% comme la plus probable.
Il suffit pour cela de considérer le chinois et le japonais, qui vraisemblablement
ont un poids du même ordre que celui de l'allemand ou de l'espagnol (entre
5 et 8%), ainsi que celui des langues qui représentent entre 0,5% et 3% (coréen,
hollandais, russe et les quatre langues scandinaves pour un total entre 8
et 10%), celle des langues dont la présence est très faible, comme le roumain
(à savoir une dizaine de langues à 0,1% pour un total de 1%) et, finalement,
les très nombreuses langues dont la présence reste marginale. Cette dernière
proportion est la plus difficile à estimer ; en retenant l'hypothèse de 200
langues à 0,01%, on atteint un total de 2%... L'une des grandes inconnues,
dont les conséquences resteront à évaluer pour le futur, est la possible multiplication
des langues sur l'Internet, le total des langues existantes étant calculé
entre 3000 et 6000
Ces estimations nous font arriver à un poids total avoisinant les 25% pour les langues
non étudiées et donc nous pousse à soutenir l'hypothèse d'une présence absolue proche de 52% pour l'anglais.
Cette estimation du chiffre de
25% pour le poids des langues non prises en compte directement dans l'étude
est renforcée par l'évolution dynamique du poids de celles-ci décrite en détail
dans le chapitre 4.3.3.
| Anglais | Espagnol | Français | Italien | Portugais | Roumain | Allemand | |
| Présence absolue (nombre de locuteurs)) |
|
|
|
|
|
|
|
| Relative presence
(% of world popn.) |
|
|
|
|
|
|
|
|
Présence absolue 2001 |
Présence pondérée 1998 |
Présence pondérée 2000 |
Présence pondérée 2000 |
|
|
ANGLAIS |
52,00% |
7,14 |
5,71 |
4,95 |
|
ESPAGNOL |
5,69% |
0,40 |
0,78 |
0,91 |
|
FRANÇAIS |
4,61% |
1,30 |
2,02 |
2,12 |
|
ITALIEN |
3,06% |
1,50 |
2,77 |
3.06 |
|
PORTUGAIS |
2,81% |
0,26 |
0,68 |
0.88 |
|
ROUMAIN |
0,17% |
0,30 |
0,38 |
0.34 |
|
ALLEMAND |
> 6,97% |
Non disponible |
3,153 |
3,493 |
Table 5: Nombre d'internautes classés par langue (en millions)
|
Anglais |
Espagnol |
Portugais |
Français |
Italien |
Roumain |
Alleman |
Reste |
|
|
Internautes (en millions) |
215,6 |
20,4 |
16,6 |
14,2 |
11,5 |
0,6 |
27,5 |
146,2 |
|
Répartition en % |
47,6% |
4,5% |
3,7% |
3,1% |
2,5% |
0,13% |
6,1% |
32,2% |
Table 6: Productivité des locuteurs
|
Pages |
Internautes |
P/I |
|
|
ANGLAIS |
52,00% |
47,6% |
1,09 |
|
ESPAGNOL |
5,69% |
4,5% |
1,26 |
|
FRANÇAIS |
4,61% |
3,7% |
1,25 |
|
ITALIEN |
3,06% |
3,7% |
1,25 |
|
PORTUGAIS |
2,81% |
2,5% |
1,12 |
|
ROUMAIN |
0,17% |
0,13% |
1,31 |
|
ALLEMAND |
6,97%4 |
6,1% |
1,14 |