Memoria Mistica
MISTICA: El peso real del inglés en la red

MISTICA: El peso real del inglés en la red

Write haof XML files: Daniel Pimienta ^lt;pimienta_at_funredes.org>
Fecha: vie 04 nov 2005 11:38:22 AST
Message-Id: <200511041853.jA4Irrma014451@samana.funredes.org>

>"Tres de cada cuatro páginas en Internet están
>escritas en inglés. Sin embargo, el número de
>cibernautas cuya lengua materna no es el inglés
>excede del 50 por ciento, porcentaje que sigue
>aumentando", indica el documento.

No puedo hacer otra cosa que expresar
publicamente mi molestia cuando leo afirmaciones
de este tipo procedentes de informes de la
Unesco, cosa que ya he hecho publicamente en una
reunión organizada recien por la Unesco, en Bamako, sobre el mismo tema
http://portal.unesco.org/ci/fr/ev.php-URL_ID=17688&URL_DO=DO_TOPIC&URL_SECTION=201.html

¿Por qué la Unesco persiste en publicar cifras
tan remotas de la realidad y, con el gran
prestigio que tiene su nombre, le confiere a
cifras sin solidez científica un crédito de "verdad oficial"?

Hoy en día se estima que el porcentaje de
anglófonos con acceso a la Internet es del orden
de 35% lo que ya es bastante remoto del
50% (Fuente Global Reach http://global-reach.biz/globstats/index.php3 ).

Nuestro estudio sobre espacio de la lenguas en la
red (http://funredes.org/lc ) le da un peso de
45% al inglés en la web, mucho menos que el 75%
que le atribuye la Unesco (aunque explicamos en
el documento nuestras propias limitaciones metodológicas).

La fuente de la Unesco es probablemente el estudio siguiente:
   "Trends in the Evolution of the Public Web:
1998 ­ 2002", O'Neill & al. 2003.
   http://www.dlib.org/dlib/april03/lavoie/04lavoie.html

Además de ofrecer datos viejos de 3 años en un
espacio que cambia a gran velocidad (entre 2002 y
2005, el número de internautas chinos paso de
menos de un millón a 100 millones y el porcentaje
de internautas con lenguas asiáticas llego al 33%
del total), el estudio usa una metodología de la
cual hemos mostrado las limitaciones con argumentos sólidos.

La metodología es la misma que la del estudio
Alis Technologies/ISOC del 1998 (ver http://alis.isoc.org/index.es.html ).

Se constituye al azar una base de algunos miles
de numeros de IP que corresponden a servidores HTTP
(ver http://www.oclc.org/research/publications/arr/1997/oneill ).
Luego se aplica, una sóla vez, a esta base un
algoritmo de reconocimiento de idioma y se toma
el resultado como producto del estudio.

El método tiene problemas mayores:

1) Los métodos de reconocimiento de idioma tienen
una fuerte tendencia a reconocer el inglés en
casos erroneos lo que no les descalifica para un
trabajo rutinario pero sí como base de un metodo
de contabilidad de lenguas pues ofrecen
resultados que da una ventaja erronea al
inglés. Basta con hacer pruebas a la mano para
ver este fenómeno. Pero eso es lo de menos y
confiamos que podrán mejorar esos algoritmos.

2) En términos estadísticos, el método no tiene
absolutamente ningún fundamento.
Y ese es el punto clave.

La manera correcta en terminos estadísticos sería
de repetir el experimento varias veces y analizar
la distribución de la variable constituida
(promedio, varianza, intervalo de confianza...)
con las herramientas estadísticas tradicionales (covarianza, ley de Fisher...).

Un sólo resultado no representa ni se aproxima de
la realidad; es sólo un punto en el espacio del
azar. Si se hubiera repetido el método 100 veces
y que la cifra de 75% sería el promedio del
resultado, tendría mas sentido el resultado ...
aunque quedaría por observar la función de
distribución y en particular su covarianza para
determinar la calidad estadística del resultado.
En ausencia de ese procedimiento ese resultado no
tiene mas sentido que una expresión al azar.

Para la Cumbre, la Unesco (IUS) va a publicar un
informe de muchos autores intitulado "Midiendo la
diversidad lingüística en la Internet".

Ese informe originalmente ofrecia la visión de un
universitario norteamericano quien también
retomaba como fuente el estudio de O'Neill
y daba poco crédito a fuentes en otros idiomas
que el inglés, confiando que desde 1998 el
espacio del inglés en la web no ha cambiado a
pesar de que el número de internautas anglofonos ha pasado de 80 % a 35%!!!

He logrado la publicación en el mismo informe de
nuestra visión y la de algunos autores de otros
países. Les informaré cuando salga
publicado.

La molestia no es sencillamente la de un autor
que sufre por ver reconocidas otras fuentes que la suya: ¡es otra cosa!

Es que contribuir a la desinformación sobre el
espacio del inglés en la Internet es una manera
indirecta y eficiente de promover la idea falsa
de que no vale la pena producir contenidos
locales en lenguas locales, idea violentemente
contraria a todas las políticas de desarrollo en nuestro campo...
Nearby Fri Nov 4 14:53:58 2005

Este archivo fue generado por hypermail 2.1.8 : dom 01 ene 2006 13:01:06 AST AST