L'entropie

 

L'entropie est une fonction qui permet de quantifier le "désordre". Elle a été utilisée à l'origine en thermodynamique, puis a trouvé des applications en théorie de l'information et plus récemment en linguistique[6]. Nous l'utilisons ici pour différencier une langue parlée dans un seul pays d'une langue parlée dans plusieurs pays. Nous appellerons pi la proportion des locuteurs d'une langue donnée vivant dans chacun des pays concernés.

Classiquement l'expression mathématique de l'entropie est la suivante :

Entropie = -Σ(Pi x Log(Pi))

dans laquelle pi est la probabilité pour un système de se trouver dans un état donné et Log(pi) le logarithme naturel de cette probabilité, le symbole Σ indique que l'on fait la somme de tous les états pi possibles. Dans notre cas nous utilisons évidemment pi ainsi que défini plus haut, la proportion des locuteurs de la langue considérée dans chacun des pays où elle est parlée. La valeur minimale de cette fonction est zéro, lorsque la langue en question n'est parlée que dans un seul pays, et il n'existe pas de valeur maximale définie.

Considérons une langue parlée très majoritairement (98%) dans un pays et dont quelques locuteurs vivent dans un second, l'entropie sera :

(0,98 x Log(0,98) +0,02 x Log(0,02)) = 0,098

Une langue dont les locuteurs sont répartis de manière égale sur trois pays aura une entropie de :

(0,33 x Log(0,33) + 0,33 x Log(0,33) + 0,34 x Log(0,34)) = 1,099

 

Voyons à présent quelques exemples réels, ceux du russe, du japonais, du haoussa, du filipino, de l'arabe standard et du chinois mandarin :

 

Langue

Russe

Japonais

Haoussa

Filipino

Arabe standard

Chinois mandarin

Entropie

0.330

0

0.689

0

3.219

0.0396

Locuteurs

125 M

120M

25M

25M

?

845M

Tableau 1 : Entropie et nombre de locuteurs de quelques langues

 

Le russe et le japonais ont des valeurs similaires en ce qui concerne le nombre de locuteurs mais le japonais n'est pratiquement pas parlé en dehors du Japon alors que des communautés russophones existent dans les pays de l'ex Union Soviétique. Le haoussa est une langue véhiculaire parlée dans plusieurs pays du Sahel alors que le filipino n'est parlé qu'aux Îles Philippines, ils ont tous deux environ vingt-cinq millions de locuteurs. L'arabe standard n'a pas un nombre important de locuteurs en langue première mais est considérée comme une langue présente dans de nombreux pays arabo-musulman. Le chinois mandarin est la langue plus parlée dans le monde mais une proportion très faible de ses locuteurs en L1 vit hors de Chine. L'entropie quantifie cet état de fait en donnant au russe plus d'importance qu'au japonais, au haoussa plus qu'au filipino et à l'arabe standard plus qu'au chinois mandarin, sur ce point particulier.

L'entropie n'a donc rien à voir avec le nombre global de locuteurs d'une langue, mais bien avec la façon dont ces locuteurs sont répartis dans l'aire ou les aires dans lesquelles cette langue est parlée. Elle est calculée à partir des données de population décrites plus haut.

[6] http://unesdoc.unesco.org/images/0014/001421/142186f.pdf

 

L'entropie, 10.0 out of 10 based on 1 rating

Les termes les plus utilisés

Geek (30,34)
réseaux sociaux (28,32)
communication (25,29)
couchsurfing (24,28)
thriller (23,27)
binge drinking (20,24)
Happy Hour (20,24)
noob (20,24)
réseaux sociaux (20,24)
Feedback (19,23)
garden party (17,21)
peanuts (17,21)
blogueur (16,20)
liker (15,19)
page turner (15,19)
root (15,19)
eReader (14,18)
sibling (14,18)
User centric (13,17)
veganism (13,17)
crowdsourcing (12,16)
Drive (12,16)
Unmanned Aerial Vehicle (12,16)
User generated content (12,16)
as soon as possible (ASAP) (11,15)
COWORKING (11,15)
challenging (10,14)
Community Manager (10,14)
désimlocker (10,14)
greenwashing (10,14)
Leveling (10,14)
Mug (10,14)
Networking (10,14)
open source (10,14)
upcycling (10,14)
cent (9,13)
edit (9,13)
fashionitas (9,13)
FLASHCODE (9,13)
framework (9,13)
mook (9,13)
développement durable (9,13)
back office (8,12)
box office (8,12)
freak (8,12)

WP-Cumulus nécessite Flash Player 9 ou supérieur.

Suggérez vos termes

Saisissez dans le champ ci-dessous le terme étranger que vous souhaitez proposer à la communauté

Poids des langues

Lorsque l'on s'interroge sur l'importance relative des langues, le critère du nombre de locuteurs est toujours le premier à apparaître : quelle est la langue la plus parlée au monde ? Combien de gens parlent cette langue ? etc.
Mais cette approche pose un double problème 
D'une part, le décompte des locuteurs n'est pas une science exacte et les différentes sources disponibles donnent des chiffres différents et ne parviennent pas toujours aux mêmes classements.
Par ailleurs, d'autres facteurs jouent un rôle dans la détermination du "poids" des langues.

Ce baromètre repose sur onze facteurs pour le moment et il est amené à évoluer par l'incorporation de nouveaux facteurs.