ACTIVITES DE FUNREDES POUR LA PROMOTION DE LA DIVERSIT� LINGUISTIQUE DANS L'INTERNET ET ENSEIGNEMENTS DE L'EXPERIENCE
Texte associ� � la pr�sentation de Daniel Pimienta sur le th�me "collecte et analyse des indicateurs r�gionaux" lors de la session 3 "Mesurer la diversit� linguistique" lors de la conf�rence "Multilinguisme pour la diversit� culturelle et la participation de tous dans le cyberespace".
http://portal.unesco.org/ci/en/ev.php-URL_ID=17688&URL_DO=DO_TOPIC&URL_SECTION=201.html
Voir la pr�sentation �: http://funredes.org/presentation/bamako2005.ppt
Bamako, 8/5/2005
Daniel Pimienta, [email protected]
Association R�seaux & D�veloppement
http://funredes.org
1- INTRODUCTION
2- ENSEIGNEMENTS DES EXPERIMENTATIONS DE FUNREDES DEPUIS 1988
2.1 MULBRI 1988-1992
2.1 ENSEIGNEMENTS DE MULBRI
2.2 CONFERENCE ELECTRONIQUE REDALC 1989-1995
2.2 ENSEIGNEMENTS DE LA CONFERENCE REDALC
2.3 EMEC 1996-2000
2.3 ENSEIGNEMENTS DU PROJET EMEC
2.4 OBSERVATOIRE DES LANGUES ET CULTURE SUR L'INTERNET 1996-
2.4 ENSEIGNEMENTS DU PROJET D'OBSERVATOIRE
2.5 MISTICA 1999-2004
2.5 ENSEIGNEMENTS DU PROJET MISTICA
2.6 TRADAUTO 1996-2005
2.6 ENSEIGNEMENTS DU PROJET TRADAUTO
2.7 TROIS ESPACES LINGUISTIQUES
2.7 ENSEIGNEMENTS DU PROJET TROIS ESPACES LINGUISTIQUES
3 CONCLUSIONS FINALES ET RECOMMANDATIONS
1- INTRODUCTION
FUNREDES est une ONG de d�veloppement avec Si�ge en R�publique Dominicaine, au Venezuela et en France. FUNREDES est un acteur de la soci�t� civile organis�e qui s'est montr� un des pionniers du th�me de l'utilisation des Technologies de l'Information et Communication pour le D�veloppement (
TICpD), travaillant depuis 1988 et ayant r�alis� nombre d'actions innovantes de
recherche-action autour du th�me de la
soci�t� de l'information, et en particulier, sur la question de faciliter la diversit� linguistique et observer la place des langues.
Le sujet qui m'a �t� attribu� est celui des indicateurs r�gionaux. N'attendez pas de moi d'exhiber de tels indicateurs: il est d�j� assez difficile de d�terminer des indicateurs globaux de la pr�sence des langues dans le cyberespace!
Je comprends plut�t que mon r�le est de montrer une vision de terrain, depuis la perspective de la soci�t� civile, et de commenter les le�ons apprises de nos exp�riences d'appui � la diversit� linguistique et culturelle, depuis 1988. A partir de l�, j'essaierais de tirer des conclusions et recommandations utiles pour cette r�union et les actions qui peuvent en d�couler.
2- ENSEIGNEMENTS DES EXPERIMENTATIONS DE FUNREDES DEPUIS 1988
2.1 MULBRI 1988-1992
La premi�re exp�rience de FUNREDES dans le champ de la diversit� linguistique date de la p�riode 1989-1992. En ce temps l� les r�seaux s'appelaient BITNET, EARN et UUCP et leur acc�s se faisaient � partir de terminaux reli�s � de gros ordinateurs. La r�cente apparition des PC ouvrait de nouvelles perspectives pour des logiciels d'interface aux r�seaux pour que l'interface soit d�centralis� dans le PC. C'est ainsi que MULBRI (Messagerie de l'Union Latine pour les R�seaux de la Recherche, en espagnol) fut con�ue et r�alis�e, comme un des premiers
1 interfaces PC aux r�seaux (BITNET, puis UUCP) avec le multilinguisme en plus (le programme avait la propri�t� de changer de langue � partir d'une commande). A cette p�riode, Windows n'�tait pas encore apparu et le programme s'appuyait sur le syst�me DOS. L'investissement n�cessaire pour r�aliser une version pour Internet ne pu �tre trouv� et le projet s'arr�ta, non sans avoir servi pour quelques r�seaux, en particulier le r�seau REDID, de la R�publique Dominicaine.
R�f�rence: http://funredes.org/english/publicaciones/index.php3/docid/33
2.1 ENSEIGNEMENTS DE MULBRI
Je vais retenir de cette aventure le principe que nous avions adopt� d'am�liorer progressivement la qualit� de l'interface � partir des �valuations et commentaires des utilisateurs, de mani�re r�cursive, avec une fr�quence soutenue de consultation et de cr�ation de nouvelle version. En quelques it�rations, nous obtenions un interface simple et ergonomique qui r�pondait � la demande. Ce principe de design d'interface avec les utilisateurs est � retenir et il permet, s'il est fait localement, de mieux adapter les interfaces aux cultures. Car l'exp�rience montra aussi que si bien le multilinguisme de l'interface �tait un atout essentiel qui permettait par exemple une utilisation en Ha�ti et en R�publique Dominicaine, la traduction ne r�sout pas tout, dans la mesure o� un interface doit r�pondre non seulement � une langue donn�e mais aussi � une culture donn�e (les utilisateurs impliqu�s dans le design interactif de l'interface avait �t� ceux de l'Union Latine et non pas ceux des r�seaux dominicains et ha�tiens).
2.2 CONFERENCE ELECTRONIQUE REDALC 1989-1995
A cette �poque, les conf�rences �lectroniques �taient caract�ris�es par une forte tendance � l'exclusivit� de l'anglais, et des "flames"
2 apparaissaient chaque fois que le th�me de l'utilisation possible d'une autre langue �tait abord� et en particulier quand, par exemple, un latino-am�ricain "osait" s'exprimer en espagnol. Cela installait des situation de tensions en spirale qui finissaient par rendre impossible le dialogue et qui ont pu an�antir plus d'une conf�rence �lectronique de qualit�.
Le projet REDALC fut un ambitieux projet, appuy� par l'Union Europ�enne et conduit par l'Union Latine (la matrice de FUNREDES) en collaboration avec l'UNESCO. Il traitait de la cr�ation d'une infrastructure et d'une infostructure r�gionale pour les r�seaux de la recherche et de la soci�t� civile d'Am�rique latine et des Cara�bes. En marge et en synergie avec ce projet, fut cr��e une des premi�res conf�rences �lectroniques r�gionales pour la mise en r�seau des chercheurs et acteurs de la soci�t� civile qui devint une r�f�rence et le creuset de beaucoup d'actions et de vocations r�gionales dans le domaine des TICpD. D'une certaine mani�re le projet MISTICA que je vais d�crire plus loin est la prolongation et extension de cette premi�re communaut� virtuelle qui parlait du r�seau sur le r�seau.
R�f�rence: http://funredes.org/english/carpeta.php3/temaid/3
2.2 ENSEIGNEMENTS DE LA CONFERENCE REDALC
Les deux le�ons principales furent:
1) La justesse du principe adopt� pour �viter les querelles linguistiques: chaque personne est libre d'utiliser le langage de son choix et personne n'a le droit de lui reprocher ce choix. Bien entendu, il s'agit l� d'une d�cision dont cette personne doit assumer seule les cons�quences (en particulier le risque de ne pas �tre compris par la majorit�). Ainsi la langue principale de la conf�rence REDALC �tait l'espagnol, mais le portugais, le fran�ais et l'anglais, autres langues de la r�gion, �taient souvent utilis�es et parfois (trop rarement) une personne d�cidait d'utiliser une langue indig�ne ou une autre langue.
2) La naissance du besoin d'offrir des solutions de traductions automatiques pour permettre que l'option de libert� de choix d'une langue minoritaire ne soit pas celle de l'isolement.
2.3 EMEC 1996-2000
L'�volution du r�seau apr�s la naissance du web et la massification
3 du r�seau eurent un impact tr�s fort sur les conf�rences �lectroniques entra�nant � la fois une augmentation des conf�rences et des contributions crois�es et une perte des pratiques de respect des r�gles (netiquette) dans les espaces virtuels. Le besoin se fit sentir pour une gestion du rapport signal sur bruit et une ouverture au multilinguisme. Le projet EMEC fut con�u pour r�pondre � ces deux d�fis. EMEC proposait une gestion organis�e d'une conf�rence �lectronique autour des principes de gestion documentaire et de traduction par palier, organis�e autour de l'adjonction des moyens du web � ceux des listes de discussion. La mod�ration �tait structur�e comme un groupe avec des fonctions compl�mentaires: une personne �tait charg�e de faire la synth�se de chaque contribution, accompagn�e d'un en-t�te au format documentaire; cette synth�se �tait traduite par d'autres personnes dans les quatre langues choisies et le texte de la contribution �tait traduit par programme et r�vis�. Le tout �tait conserv� sur le web et le syst�me permettait � un utilisateur de choisir sa (ou ses) langue de r�ception et de d�terminer son int�r�t pour une lecture compl�te de la contribution dans un minimum de temps.
Le projet fut formul� en 1996 mais ce n'est qu'en 2000 qu'une premi�re exp�rience grandeur nature pu �tre r�alis�e, gr�ce au soutien de l'IDRC, pour le projet MISTICA (voir plus loin). L'exp�rience dura pr�s d'un an et fut tr�s positivement �valu�e par les abonn�(e)s de MISTICA. Tout le mat�riel de l'exp�rience ainsi que les �valuations est encore consultable en ligne. Le bilan �conomique montra que le co�t unitaire de chaque message avec une gestion pour quatre langues �tait de 20 US$, montant qui pu �tre r�duit de moiti� avec la programmation d'un syst�me de gestion sous PHP. Un investissement de cet ordre, correspondant � un montant annuel de l'ordre de 10,000 US$ par an pour une discussion produisant 1000 contributions par an paraissait �norme dans un contexte o� les communaut�s virtuelles se d�veloppaient par l'appui solidaire d'universitaires ou d'acteurs de la soci�t� civile.
R�f�rences:
http://funredes.org/emec
http://www.upgrade-cepis.org/issues/2002/1/up3-1Pimienta.pdf
2.3 ENSEIGNEMENTS DU PROJET EMEC
Le march� n'�tait pas encore pr�t en 2000 pour un tel investissement et le projet ne pu trouver d'autres soutiens pour continuer son am�lioration et son extension. Si pour le moment le projet reste en suspens, les besoins auxquels il r�pond sont toujours pr�sents et devraient bient�t, dans la mesure o� les approches par communaut�s virtuelles gagnent du cr�dit dans le monde commercial, cr�er une r�elle demande.
Les enseignements principaux de EMEC sur le terrain de la diversit� linguistique concernent l'utilisation des programmes de traduction automatique. La premi�re le�on concerne l'�quation co�t/service de traduction, une relation complexe qui rend difficile l'abordage et la communication sur ce genre de service. La question n'est pas s'il faut ou non utiliser la traduction mais plut�t sous quelle forme et � quel prix et la r�ponse d�pend �videment de chaque situation particuli�re. Le tableau suivant, construit � partir de donn�es subjectives et approximatives pr�tend donner une id�e du large �ventail des possibilit�s.
|
SERVICE
|
COUT
|
QUALITE
|
|
Traduction par programme, sans r�vision
|
1
|
tr�s mauvaise
|
|
Traduction par programme, avec r�vision
|
5
|
mauvaise
|
|
Traduction par programme, avec normalisation de l'entr�e
|
20
|
m�diocre
|
|
Traduction par programme, avec normalisation de l'entr�e et r�vision
|
25
|
faible
|
|
Traduction non professionnelle assist�e par programme
|
50
|
acceptable
|
|
Traduction professionnelle
|
100
|
bonne
|
|
Traduction de la meilleure qualit� professionnelle
|
1000
|
excellente
|
Cette situation rend la gestion de la traduction automatique une affaire d�licate dans le monde virtuel: les utilisateurs esp�rent des r�ponses simples, presque binaires, alors que l'�ventail des possibilit�s est pratiquement un continu et que la solution idoine doit trouver l'optimum entre l'investissement et le produit obtenu. Ainsi le malentendu subsiste sur la nature des programmes de traduction qui peuvent fournir des r�sultats d'une qualit� surprenante si l'effort est consenti au niveau de l'orthographe, de la syntaxe et du style mais qui produisent des r�sultats catastrophiques dans les autres cas... Cela oblige � r�p�ter l'avertissement qu'il ne s'agit pas d'une traduction mais d'une approximative aide � l'intercompr�hension. Le fait que les recommandations pour que l'effort de r�daction soit pris comme une marque de consid�ration pour les communaut�s qui ont des difficult�s avec la langue dominante ne sont malheureusement que rarement pris en compte et la d�gradation de la netiquette dans les listes de discussion rendent tr�s hasardeuse des utilisations dans le cadre de listes non mod�r�es.
2.4 OBSERVATOIRE DES LANGUES ET CULTURE SUR L'INTERNET 1996-
Ce projet de FUNREDES a d�marr�, de mani�re extr�mement artisanale, en mars 1996, � l'occasion de la Journ�e de la Francophonie, en r�action � la position de certains milieux francophones qui voyaient dans l'Internet, et sp�cialement sur le web, une domination absolue de l'anglais et en tiraient des recommandations absurdes d'�loignement. L'id�e �tait de se servir de la puissance des moteurs de recherche et du fait qu'ils ont pris l'habitude de compter les occurrences de mots ou expressions dans l'espace web et de prouver d'une part que le chiffre avanc� de plus de 90% de pages web �tait faux et que culturellement le web ne comportait pas de parti pris contre le monde francophone. La d�monstration fut faite dans les deux cas.
Au d�part, une technique tr�s empirique et approximative, la m�thode s'est rapidement enrichie, gr�ce � l'apport linguistique de l'Union Latine et s'est transform�e en une des rares m�thodes capables de r�p�ter les mesures d'ann�e en ann�e et de documenter de mani�re enti�rement transparentes son proc�d�
4.
De plus, cette observation, qui a toujours fournit des r�sultats coh�rents et d'une bonne qualit� statistique, a permis de d�montrer la persistante d�sinformation qui s'est impos�e sur la place de l'anglais dans l'Internet et qui se maintient encore, y compris malheureusement parfois au sein de l'Unesco, qui donne cr�dit � une �tude d'OCLC
5 de 2003 pla�ant l'anglais � 72% sur le web. Cette d�sinformation pouvant produire l'effet pervers de d�mobiliser les producteurs de contenus en d'autres langues, FUNREDES d�cida de mener ce combat avec toute son �nergie.
Des chiffres entre 70 et 80%, qui datent de 1996 quand 80% des internautes �taient de langue anglaise sont repris r�guli�rement par les m�dias depuis cette date et semble ne pas �voluer alors que l'Internet est un milieu � forte dynamique et que le nombre d'�nternautes de langue anglaise est pass� aujourd'hui sous la barre des 40%
6 et qu'� l'�vidence la production des pages web dans une langue donn� suit la courbe de croissance des internautes dans cette langue!
Les r�sultats des mesures de FUNREDES montrent une d�croissance importante du pourcentage de pages web en anglais qui accompagne la r�duction du pourcentage d'�nternautes anglophones.
Il n'est pas l'objet ici d'entrer dans une pol�mique d'expert sur les m�thodes et le lecteur int�ress� pourra (ou malheureusement ne pourra pas dans de nombreux autres cas) se documenter et comparer les m�thodes.
Quels sont les indicateurs que la m�thode � permis de trouver?
|
DATE
|
%PAGES WEB
EN ANGLAIS
(source
FUNREDES)
|
% INTERNAUTES
ANGLOPHONES
(source
GlobalReach)
|
|
96
|
>80%
|
>80%
|
|
09-98
|
75%
|
|
|
08-00
|
57%
|
50%
|
|
01-01
|
55%
|
|
|
06-01
|
52%
|
|
|
08-01
|
51%
|
|
|
10-01
|
50.5%
|
|
|
02-02
|
49%
|
46%
|
|
02-03
|
45%
|
37%
|
|
04-04
|
40%
|
36%
|
|
05-05
|
< 40.0%
|
35%
|
Ce qui est important, c'est que la m�thode a permis de produire un certain nombre d'indicateurs qui pourraient servir � soutenir des politiques linguistique dans le cyberespace. Comment �tablir des politiques pour les langues sans d�tenir un �tat des lieux et des outils de suivi? Ce message, FUNREDES l'a r�p�t� inlassablement depuis 1996 et il semble qu'en 2005 nous arrivons enfin au moment o� il est pris au s�rieux et que le monde acad�mique et les organismes internationaux commencent enfin � s'y int�resser.
Les tableaux ci-apr�s donnent une id�e. Pour plus de d�tails et pour les commentaires consulter le site (
http://funredes.org/lc) ou les derni�res �tudes publi�es:
Sauf indication contraire, la source des chiffres indiqu�s ci-apr�s est FUNREDES.
|
Pr�sence absolue sur
la Toile - 2003
|
|
ANGLAIS
|
45,0%
|
|
ESPAGNOL
|
4,87%
|
|
FRAN�AIS
|
3,97%
|
|
ITALIEN
|
2,38%
|
|
PORTUGAIS
|
2,05%
|
|
ROUMAIN
|
0,10%
|
|
ALLEMAND
|
6,24%
|
|
AUTRES LANGUES
|
35,39%
|
Poids des langues �tudi�es (Source Union Latine 7 - chiffres arrondis en millions, 2000)
| |
Anglais |
Espagnol |
Français |
Italien |
Portugais |
Roumain |
Allemand |
| Présence absolue (nombre de locuteurs) |
630 |
375 |
130 |
60 |
190 |
30 |
120 |
| Présence relative (pourcentage mondial) |
10,50% |
6,25% |
2,17% |
1% |
3,17% |
0,50% |
2% |
| |
Présence absolue 2003 |
Présence pondérée 1998 |
Présence pondérée 2000 |
Présence pondérée 2003 |
| ANGLAIS |
45% |
7,14 |
5,71 |
4,29 |
| ESPAGNOL |
4,87% |
0,40 |
0,78 |
0,78 |
| FRANÇAIS |
3,97% |
1,30 |
2,02 |
1,83 |
| ITALIEN |
2,38% |
1,50 |
2,77 |
2,38 |
| PORTUGAIS |
2,05% |
0,26 |
0,68 |
0,65 |
| ROUMAIN |
0,10% |
0,30 |
0,38 |
0,21 |
| ALLEMAND |
6,24% |
Non disponible |
3,15 |
3,12 |
| Source GlobalReach (2003) |
Anglais |
Espagnol |
Portugais |
Français |
Italien |
Roumain |
Reste |
| Internautes(en millions) |
217,8 |
20,4 |
12,1 |
16,6 |
17,5 |
0,6 |
191 |
| Distribution(en %) |
45,76% |
4,29% |
2,54% |
3,49% |
3,68% |
0,13% |
40,13% |
| Productivité des locuteurs (2003) |
Pages |
Internautes |
P/I |
| ANGLAIS |
45% |
37% |
1,22 |
| ESPAGNOL |
4,87% |
7,6% |
0,64 |
| FRANÇAIS |
3,97% |
4,2% |
0,95 |
| ITALIEN |
2,38% |
3,9% |
0,62 |
| PORTUGAIS |
2,05% |
3,1% |
0,67 |
| ROUMAIN |
0,10% |
0,4% |
0,28 |
| ALLEMAND |
6,24% |
6,8% |
0,92 |
Productivit� des r�gions en langue espagnole (2001)
|
Espagne
|
54 %
|
|
Am�rique latine et
Cara�bes
|
35 %
|
|
�tats-Unis
|
5 %
|
|
Reste du monde
|
6 %
|
Productivit� des pays pour la langue espagnole (2001)
|
|
Contribution � la production de pages en
espagnol
|
Nombre d'internautes
|
Pourcentage du total des internautes de
langue espagnole
|
PRODUCTIVIT�
pour contenus en espagnol
|
|
Argentine
|
9,54%
|
2,5
|
7,18%
|
1,33
|
|
Chili
|
3,66%
|
0,63
|
1,81
|
2,02
|
|
Colombie
|
3,92%
|
0,6
|
1,72%
|
2,27
|
|
Costa Rica
|
0,64%
|
0,15
|
0,43%
|
1,48
|
|
Cuba
|
0,58%
|
0,06
|
0,17%
|
3,36
|
|
Espagne
|
53,92%
|
7
|
20,11%
|
2,68
|
|
�tats-Unis
|
5,00%
|
15
|
43,08%
|
0,12
|
|
Mexique
|
8,57%
|
6,7
|
19,24%
|
0,45
|
|
P�rou
|
1,41%
|
0,4
|
1,15%
|
1,23
|
|
Porto Rico
|
0,20%
|
0,2
|
0,57%
|
0,35
|
|
Uruguay
|
1,20%
|
0,3
|
0,86%
|
1,39
|
|
Venezuela
|
1,43%
|
0,95
|
2,73%
|
0,52
|
Productivit� des pays pour la langue fran�aise (2003)
|
|
%Pages en fran�ais
|
Internautes francophones
(en millions) 8
|
% Internautes francophones
|
Productivit� par pays
|
|
Suisse
|
6,5%
|
0,90
|
3,5%
|
1,88
|
|
Belgique
|
6,0%
|
1,00
|
3,8%
|
1,56
|
|
Canada
|
24,2%
|
4,40
|
16,9%
|
1,43
|
|
France
|
56,2%
|
18,70
|
71,9%
|
0,78
|
|
Reste
|
9,9%
|
9
|
3,85%
|
|
|
TOTAL
|
100%
|
26
|
100%
|
1
|
PRODUCTION DE PAGES EN ANGLAIS PAR DOMAINE (2003)
| DOMAINES GENERIQUES |
| |
.com |
36,492% |
| |
.org |
18,821% |
| |
.edu |
13,759% |
| |
.net |
5,363% |
| |
.gov |
2,572% |
| |
.int |
0,224% |
| TOTAL |
77,231% |
|
| AUTRES DOMAINES |
| ALLEMAGNE |
.de |
1,837% |
| JAPON |
.jp |
0,718% |
| RUSSIE |
.ru |
0,596% |
| HOLLANDE |
.nl |
0,586% |
| FRANCE |
.fr |
0,531% |
| ITALIE |
.it |
0,438% |
| SUEDE |
.se |
0,435% |
| COREE |
.kr |
0,270% |
| CHINE |
.cn |
0,246% |
| FINLANDE |
.fi |
0,228% |
| NORVEGE |
.no |
0,217% |
| ESPAGNE |
.es |
0,194% |
| ISRAEL |
.il |
0,118% |
| E.A.U |
.ae |
0,008% |
| PORTUGAL |
.pr |
0,000% |
| TOTAL |
6,422% |
|
| PAYS ANGLOPHONES |
| ROY. UNIS |
.uk |
5,788% |
| CANADA |
.ca |
2,575% |
| AUSTRALIE |
.au |
2,435% |
| ETATS UNIS |
.us |
2,058% |
| N. ZELANDE |
.nz |
0,410% |
| AFR.DU SUD |
.za |
0,375% |
| IRLANDE |
.ie |
0,339% |
| HONGKONG |
.hk |
0,154% |
| SINGAPOUR |
.sg |
0,137% |
| INDE |
.in |
0,110% |
| ZIMBABWE |
.zw |
0,009% |
| JAMAIQUE |
.jm |
0,003% |
| TOTAL |
14,390% |
|
�volution du nombre de pages mentionnant des personnages embl�matiques des respectives cultures (1998-2001)
| |
USA |
ES |
FR |
PO |
IT |
RU |
Reste |
TOTAL |
| Sciences |
375% |
786% |
528% |
|
405% |
661% |
416% |
426% |
| Lettres |
375% |
571% |
539% |
721% |
539% |
466% |
471% |
483% |
| Cinéma |
422% |
640% |
534% |
532% |
506% |
502% |
547% |
455% |
| Musique |
487% |
954% |
508% |
717% |
590% |
630% |
411% |
487% |
| Arts |
406% |
541% |
592% |
564% |
482% |
448% |
549% |
519% |
| Politiques |
334% |
617% |
411% |
478% |
753% |
580% |
510% |
407% |
| Médiatiques |
434% |
622% |
679% |
462% |
476% |
726% |
429% |
452% |
| Historiques |
290% |
433% |
422% |
72% |
473% |
|
354% |
344% |
| Imaginaires |
227% |
585% |
241% |
468% |
296% |
240% |
290% |
264% |
| Général |
299% |
537% |
425% |
452% |
446% |
458% |
358% |
352% |
| Vs. moyenne |
-15,06% |
52,56% |
20,74% |
28,41% |
26,70% |
30,11% |
1,70% |
0,00% |
| Vs. USA. |
0,00% |
79,60% |
42,14% |
51,17% |
49,16% |
53,18% |
19,73% |
17,73% |
R�f�rence: http://funredes.org/lc
2. 4 ENSEIGNEMENTS DU PROJET D'OBSERVATOIRE
Le premier enseignement est que le monde acad�mique, qui pourtant a �t� le grand promoteur des r�seaux, a abandonn� le terrain de l'observation au monde du marketing qui publie des donn�es d�mographiques sur l'Internet sans offrir les garanties scientifiques que r�clame cette t�che essentielle pour dicter les politiques publiques ou industrielles. Il s'en est suivi une terrible confusion sur la r�alit� du panorama des langues sur l'Internet, certaines firmes se permettant de sortir des chiffres avec des raisonnements pour lesquels un �tudiant de troisi�me d�couvrirait les failles (comme Inktomi avec son "webmap", en 2000) mais la puissance m�diatique compensant la faiblesse scientifique et les chiffres faux s'imposent... Il est grand temps de mettre de l'ordre dans cette situation et les signes sont pr�sents d'un r�el changement.
Un autres enseignement est qu'il est tr�s difficile de produire des chiffres s�rieux; cela demande une application et un suivi qu'aucun groupe n'a pu montrer jusqu'� aujourd'hui. En attendant, la mode est � l'utilisation des algorithmes de reconnaissance de langues et de les appliquer sur des �chantillons limit�s de sites pris au hasard sans malheureusement appliquer les m�thodes prouv�es de la statistique (r�p�ter l'op�ration plusieurs fois et analyser, comme une variable al�atoire, la distribution des r�sultats pour en tirer des produits contr�lables para la m�thode statistique). En outre, jusqu'� aujourd'hui il est clair que si l'�tat de l'art des algorithmes de reconnaissance de langues a atteint un niveau suffisant pour des applications il n'est pas suffisamment fiable pour des mesures pr�cises et a une visible tendance � favoriser le score de l'anglais.
Dans ces conditions des m�thodes artisanales appliqu�es avec s�rieux comme celle de FUNREDES ont encore leur place quoique l'�volution des moteurs de recherche laisse entrevoir le moment proche o� il ne sera plus possible de les conduire avec succ�s. La derni�re �tude est en cours et ses r�sultats seront publi�s tr�s prochainement. Dans ce contexte la constitution d'un consortium universitaire international autour du projet japonais d'observatoire
10, dot� des moyens n�cessaires, est une nouvelle exceptionnellement importante et prometteuse et nous ne pouvons que nous r�jouir de cette annonce.
Il reste qu'une v�ritable observation capable de d�passer le stade des pourcentages de ressources et de s'approcher des usages (dans quelles langues sont pratiqu�es les courriels et les chats? Quelle est la langue des sites visit�s? et non pas seulement des sites index�s ou m�me pr�sents) se fait n�cessaire et il nous semble que l'approche la plus prometteuse pourrait s'inspirer de la m�thode de Alexa
11 pour �valuer certains param�tres des sites Internet, voire m�me, si la n�gociation et la garantie d'une gestion scientifique prot�g�e des tentations commerciales sont possibles, une alliance avec ce groupe pourrait conduire � une solution plus rapide.
2. 5 MISTICA 1999-2004
MISTICA est le projet phare de FUNREDES depuis 1998; une communaut� virtuelle des sp�cialistes de TICpD de la r�gion Am�rique latine qui maintient une veille permanente sur le th�me, exp�rimente des m�thodes originales, cr�e des savoirs partag�s et tente d'influencer les politiques publiques, en particulier, en apportant des approches originales sur le th�mes des indicateurs de la soci�t� de l'information (voir aussi le projet connexe
http://funredes.org/olistica) .
Sur le plan de la diversit� linguistique, Funredes s'est donn� comme mission de g�rer la communaut�, tant sur le plan de l'information que de la communication, dans les quatre langues principales de la r�gion consid�r�e et de tenter d'ouvrir vers les langues indig�nes (ce qu'elle n'a malheureusement pas pu encore faire).
C'est une communaut� virtuelle vibrante qui a su faire des apports originaux au processus du sommet (voir UTOPISTA
12 et le document "Travailler l'Internet avec une vision sociale"
13) et dans laquelle la diversit� linguistique a connu des exp�riences innovantes comme celle d'EMEC d�j� mentionn�e.
Devant les difficult�s pour financer une version de EMEC am�lior�e par la premi�re exp�rience, le niveau minimum de traduction automatique sans r�vision a �t� maintenu, et avec le temps, les utilisateurs ont appris � en tirer quelques b�n�fices malgr� les limites �videntes de ce service.
R�f�rence: http://funredes.org/mistica
2.5 ENSEIGNEMENTS DU PROJET MISTICA
La difficult� notoire � int�grer la Cara�be anglaise dans la communaut� MITICA, en d�pit des efforts consentis, prouve que les barri�res culturelles apparaissent tr�s vite derri�re les linguistiques et qu'il faut aussi les traiter. C'est ainsi, que Funredes a entrepris, avec l'appui de l'Agence de la Francophonie, la r�union CARDICIS
14 pour aider les acteurs du champ TICpD de la Cara�be a d�couvrir leur identit� commune et � pr�ter une attention mutuelle � leurs diff�rences culturelles et linguistiques de fa�on � ce qu'elles soient un enrichissement plut�t qu'un obstacle.
En ce qui concerne les langues indig�nes, l'absence de programmes de traduction est un s�rieux handicap et les efforts d�ploy�s par Funredes pour tenter une exp�rimentation en ligne, dans le contexte de MISTICA, du travail extraordinaire de Ivan Guzman de Rojas qui utilise, dans ATAMRI
15, la langue Aymara comme langue pivot d'un programme de traduction originale, n'ont cependant pas encore pu apporter les fruits esp�r�s.
2.6 TRADAUTO 1996-2005
C'est ainsi que Funredes pris la d�cision, en 2004, d'automatiser le processus de fabrication des messages avec traduction par programme, processus qui �tait auparavant r�alis� "� la main" par des stagiaires. Cela avait pour but de lib�rer cette contrainte et de permettre de promouvoir ce service sur une base plus syst�matique. L'absence de programme disponible sous Linux repr�sente un s�rieux handicap pour r�aliser la programmation de l'interface entre le gestionnaire de liste (sous Linux) et le service de traduction automatique. La t�che d'interface entre l'environnement Linux et l'environnement Windows s'av�rant instable et probl�matique, l'option choisie a �t� celle d'un service sur le web. Le dispositif est d�crit � la page
http://funredes.org/tradauto. Il existe plusieurs variantes et un certain nombre d'options qui tendent � en faire un processus complexe: service sur le web, ou en forme de liste; dans la m�me liste ou dans des liste s�par�es; traductions concat�n�es ou s�par�es; service pr� mod�ration ou post mod�ration ou sans mod�ration; valeur ajout�e de suppression du format HTML, etc.
Ainsi le service qui avait �t� cr�� en 1996 pour une conf�rence sur la culture dans la Cara�be (
http://funredes.org/salsa) a �t� �tendu � d'autres espaces, comme le projet MISTICA, le projet dominico-ha�tien BOHIO
16, le projet CARDICIS d�j� cit�, le projet I-Jumelages
17 et, il y a quelques jours, la liste pl�ni�re de la soci�t� civile pour le SMSI
18. Tout cela repr�sente une bonne base pour �tudier le comportement du service et continuer � l'am�liorer. Il reste que l'usage optimum de la traduction par programme est celui qui est organis� avec des conf�rences �lectroniques fortement mod�r�es et o� la personne en charge de la mod�ration peut �diter les textes pour obtenir les meilleurs r�sultats.
R�f�rence: http://funredes.org/tradauto
2.6 ENSEIGNEMENTS DU PROJET TRADAUTO
Ce que nous prouve ce projet c'est que nous avions fait une erreur en voulant � tout prix offrir des services du niveau de sophistication de EMEC. Il faut �tre patient et accepter que le processus de familiarisation des techniques de la traduction automatique dans le cyberespace est lent et progressif et qu'il ne faut pas �tre r�ticent (comme nous l'avons �t�) � organiser des services de traduction automatique sans les avantages de EMEC, et m�me, pour commencer et en l'absence de budget, sans les fonctions d'am�lioration des produits (r�visions). Je reste cependant persuad� que le service minimum de traduction para programme � l'�tat brut est un pis-aller, mais il faut laisser les utilisateurs faire leur propre courbe d'apprentissage et apprendre par eux-m�mes, d'abord qu'une intervention humaine pour am�liorer le processus est vraiment souhaitable et ensuite progressivement � comprendre et accepter que ce genre de service implique un co�t et que cet investissement est justifiable, car la communication est fondamentale. A ce moment l� des projets comme EMEC pourront se d�velopper.
2.7 TROIS ESPACES LINGUISTIQUES
Il ne s'agit pas cette fois-ci d'un projet de Funredes mais de celui d'une coalition d'organisations internationales (OIF, OEI, CPLP et Union Latine) qui recouvre les aires linguistiques francophones, hispanophones et lusophones et qui a cr�� une structure d'articulation. La progression est beaucoup trop lente pour une personne de terrain, l'ajustement des cultures bureaucratiques entre ces organisations paraissant encore plus difficile que celui des cultures associ�es aux aires linguistiques! Mais le principe de f�d�rer les efforts pour "une coop�ration entre des espaces qui repr�sentent plus d'1,2 milliards de personnes sur les cinq continents est opportun.
J'ai eu la chance d'�tre associ� comme expert aux travaux de ces Trois Espaces qui comportent un important volet TIC et d�veloppement. Il est question d'organiser un observatoire des indicateurs strat�giques des langues et des cultures dans le cyberespace, d'organiser un colloque sur la e.�ducation et d'autres projets comme par exemple sur les logiciels libres.
C'est dans une r�union des trois espaces � Mexico en 2003
19, � laquelle participait Adama Samassekou, que la formule tr�s heureuse de "Soci�t� des Savoirs Partag�es" est apparue.
R�f�rences: http://3el.org
2.7 ENSEIGNEMENTS DU PROJET TROIS ESPACES LINGUISTIQUES
L'enseignement principal que je tire de cette exp�rience est que, finalement, la mesure n�cessaire pour changer profond�ment notre r�alit�, celle qui permettait que les syst�mes �ducatifs tirent parti des facult�s extraordinaires des enfants pour assimiler les langues sans avoir besoin d'en d�monter les m�caniques internes (les grammaires) passe par une r�forme radicale de l'enseignement traditionnel des langues. Il faut miser sur l'enseignement de trois langues au moins dans le syst�me �ducatif et abandonner la pr�tention absurde qu'apprendre une langue pour la communication c'est en conna�tre toutes les subtilit�s grammaticales. Je suis conscient que cette d�claration pourra choquer de nombreux enseignants mais l'enjeu de la diversit� culturelle est trop important pour continuer de buter sur des positions hom�ostatiques qui emp�chent d'atteindre un objectif essentiel pour la diversit� linguistique...
La pratique adopt�e dans les r�unions de travail des experts des Trois Espaces, o� chacun parlait sa langue et faisait l'effort de comprendre la langue de l'autre, est tout � fait possible entre des langues voisines et comporte plus d'avantages que d'inconv�nients, en particulier, elle inclut un facteur d'�ducation permanente et de vase communiquant des cultures que ne poss�de pas l'imposition d'une langue de communication ou l'interpr�tation.
J'ai acquis dans cette exp�rience la conviction que cette approche de la diversit� culturelle qui encourage la collaboration entre des aires voisines est correcte et peut �tre appliqu�e de mani�re analogue dans d'autres contextes (monde arabe, Scandinavie, pays autour de l'Allemagne, groupes indig�nes...).
3 CONCLUSIONS FINALES ET RECOMMANDATIONS
Le th�me de la diversit� linguistique ne peut �tre s�par� de celui de la diversit� culturelle. Une approche purement technique de ce th�me comporte ce grand risque. Le th�me de la diversit� culturelle (et donc aussi linguistique) est un th�me fondamental pour la Soci�t� de l'Information car il interf�re avec tous les autres th�mes majeurs (droits humains, gouvernance, propri�t� intellectuelle, paix dans le monde...).
La plus part des d�cisions qui d�favorisent la diversit� culturelle et linguistique sont faites au nom d'un certain pragmatisme ("c'est plus pratique d'imposer une langue unique de travail", "les traductions co�tent trop cher", etc.). Disons le cr�ment, certaines formes de pragmatisme sont tout simplement des abus et il faudrait temp�rer les choix pragmatiques au nom de l'�thique de l'information
20 car les choix ne sont jamais innocents et quand la balance va toujours du m�me c�t� cela tient � l'abus de position dominante et au m�pris des autres. Bien souvent la d�cision pragmatique est soutenue par une d�monstration �conomique qui ne d�voile que l'aspect imm�diat, rarement � court terme et jamais � plus long terme. Les pr�tendues �conomies faites en violant la diversit� linguistique et culturelle ne le sont pas si on �tablit les v�ritables �quations � long terme. Tant qu'� maintenir les chois pragmatiques, il serait tr�s opportun au moment o� on parle de d�veloppement humain et d'objectif du mill�naire de r�orienter les crit�res pragmatiques de d�cision vers les pays en d�veloppement, le terrain et les minorit�s!
Enfin, dans un espace o� le parti pris envers l'anglais et la culture nord-am�ricaine est extr�mement pr�sent pour d'�videntes raisons historiques
21, il est difficilement acceptable que le traitement de la th�matique "diversit� linguistique" puisse aussi �tre victime de ce parti pris! Si nous devons �tudier et �changer sur le th�me de la diversit� linguistique soyons particuli�rement prudent pour le faire dans notre langue et d'observer ce que dise les auteurs dans leur propre langue! Il y a probablement plus � apprendre sur le sujet de la pr�sence des langues dans l'Internet en lisant les publications en catalan, basque, fran�ais, espagnol, allemand, etc.. qu'en anglais!
Parmi les recommandations, je ne peux bien s�r oublier celle d'appuyer les efforts de recherche -action de la soci�t� civile qui ouvrent le chemin pour la diversit� et apporte de l'innovation sociale et du capitale humain.
ANNEXE: UN MESSAGE � LA CONFERENCE EN PROVENANCE DU TERRAIN
Date: Mon, 02 May 2005 13:07:17 -0500
From: Subbiah Arunachalam
Forwared by: Taran Rampersad
To: [email protected], [email protected], cardicis.org, [email protected]
I think Prof. Adama Samasekou of Mali will be playing a key role in this
conference on multilinguism at Bamaco. One of the things the conference
should promote is setting up open access interoperable institutional archives
in all higher education and research institutions all over Africa.
That is the only way to make access to research information affordable and
on a level playing field. Africa now has the technology (and it is
improving all the time). All it needs is the political will.