L’Anglais, une langue optimiste ?

L’étude de la langue n’est pas qu’affaire de littéraires. Elle peut aussi intéresser mathématiciens et physiciens dès lors qu’il s’agit d’en dévoiler, par une approche statistique, le génie secret, les vertus cachées mais mesurables. C’est ce que vient d’essayer une équipe américaine de l’université du Vermont en voulant répondre à la question suivante : les langages sont-ils neutres sur le plan émotionnel ou bien contiennent-ils un biais affectif, positif ou négatif ? En clair, la langue a-t-elle une tendance naturelle, quel que soit le sujet évoqué, à l’optimisme ou au pessimisme ? De quelle manière le communicant qui se cache derrière tout Homo narrativus structure-t-il le contenu émotionnel de son récit (qu’il décrive une réalité ou une fiction) ou de ses dialogues, de sa prose ou de ses vers ?

Cette équipe vient de publier ses résultats, mercredi 11 janvier, dans la revue PLOS ONE et, s’ils ne concernent que la langue anglaise, ils n’en sont pas moins étonnants. Les auteurs ont étudié quatre corpus aussi abondants que divers, courant sur des périodes temporelles différentes et écrit sur ou pour des supports variés. Je les classe ici suivant le nombre de mots, du plus petit au plus grand. Les chercheurs ont ainsi analysé quelque 300 000 textes de chansons écrits entre 1960 et 2007 (représentant au total 59 millions de mots), 1,8 million d’articles du New York Times parus entre le 1erjanvier 1987 et le 30 juin 2007 (un peu plus d’1 milliard de mots), 821 millions de tweets (des messages très courts publiés à l’aide de l’outil Twitter) rédigés entre le 9 septembre 2008 et le 3 mars 2010 (9 milliards de mots) et 3,3 millions de livres numérisés par le projet Google Books, couvrant une période allant de 1520 à 2008 (361 milliards de mots).

Pour chaque corpus, les 5 000 mots les plus fréquents ont été extraits, soit un total de 10 222 mots différents une fois que l’on a retiré les doublons entre échantillons.

Il a fallu ensuite, et c’est sans doute là la partie la plus sensible de l’étude, attribuer une valeur de 1 à 9 à chacun de ces dix milliers de mots, 1 signifiant une connotation lugubre, 9 une connotation très joyeuse et 5 un mot neutre. Typiquement, les deux extrêmes ont été les mots « terroriste » (1,3) et « rire » (8,5). Si l’on obtient des valeurs fractionnaires, c’est parce que chaque mot a été évalué par 50 personnes différentes. Au total, plus d’un demi-million de notes ont donc été attribuées. Pour cette tâche pénible, les chercheurs ont eu recours à Amazon Mechanical Turk, qui propose sur Internet les services d’une main d’œuvre bon marché pour effectuer des tâches fastidieuses dont les machines sont incapables ou qu’elles font mal (par exemple identifier des personnes ou des objets dans une vidéo ou bien retranscrire une bande son). Comme les travailleurs de l’ombre d’Amazon Mechanical Turk sont payés des queues de cerise, les auteurs de l’étude ont, pour s’assurer que la mission confiée était accomplie de manière sérieuse, comparé leurs évaluations avec celles faites, sur un millier de mots, par des étudiants américains dans une étude de 1999. Le taux de correspondance était excellent.

Une fois tout ce dispositif mis en place, il ne restait plus qu’à sortir le résultat de chaque corpus. On pouvait s’attendre à de grosses disparités et notamment à ce qu’un journal international comme le New York Times, habitué à couvrir conflits, crises, catastrophes, scandales et faits divers, fasse figure de triste sire dans le panel. Il n’en a rien été. Tous les corpus ont fait preuve d’un indécrottable optimiste comme le montrent les quatre courbes ci-dessous, dont les parties jaunes signalent les mots à connotation positive :

Le corpus dont la joie est la plus mesurées’avère celui des paroles de chansons (seulement 64,14 % de mots positifs et beaucoup moins que ça dans cet extrait célébrissime: « Eleanor Rigby, died in the church / And was buried along with her name. / Nobody came. / Father McKenzie, wiping the dirt / From his hands as he walks from the grave / No one was saved. ») tandis que le plus joyeux est celui de Google Books (78,8 %), juste devant le New York Times

(78,38 %), malgré deux guerres du Golfe, une en Afghanistan, un 11-Septembre, un ouragan Katrina, etc. Pour les auteurs de l’étude, ce biais positif plus que têtu montre que, au moins en anglais, la langue, en tant que constructrice de liens entre les personnes, ne peut s’empêcher de montrer un côté positif même quand les messages sont porteurs de mauvaises nouvelles. Un peu comme si le langage imposait aux hommes, qui croient en disposer à leur guise comme d’un outil neutre, une inoxydable quête du bonheur. Reste à déterminer, conclut l’article de PLoS ONE, si cette caractéristique est valable dans d’autres langues, si le caractère positif varie en fonction des époques, de l’organisation de la société, de l’état de santé de la population, des goûts culturels en vogue ou des structures politiques.

Pierre Barthélémy pour Le Figaro

0 réponses

Laisser un commentaire

Rejoindre la discussion?
N’hésitez pas à contribuer !

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

deux × quatre =