Trompeuses Statistiques

  • Initiateur de la discussion Initiateur de la discussion Octavius
  • Date de début Date de début
Les statistiques peuvent tromper celui qui ne sait pas les lire

On est en droit de s’interroger sur la validité des informations statistiques, ainsi que de l’interprétation qu’on peut leur donner. Car celles-ci ont une bien mauvaise réputation, comme s’en amusait déjà Mark Twain il y a plus d’un siècle: «Il y a trois sortes de mensonges: les mensonges, les sacrés mensonges et les statistiques.»

PLUS DE MENSONGES EN SUIVANT :

Sans aller aussi loin que l’humoriste américain, on doit pourtant se montrer circonspect à l’égard de toute information, chiffrée ou non. On doit ainsi à chaque fois se poser quelques questions. D’une part, il s’agit d’essayer d’évaluer le degré d’honnêteté de la statistique. Autrement dit, de savoir quelle est l’indépendance des statisticiens par rapport aux commanditaires de leurs recherches. Et, de manière corollaire, de s’intéresser aux intérêts particuliers des bailleurs de fonds, pour estimer le risque de manipulation et de son ampleur potentielle. D’autre part, il faut analyser la structure de la statistique pour en évaluer la fiabilité. Enfin, il faut soumettre toute interprétation, surtout si elle est hâtive, à la plus grande rigueur critique.

Concrètement, comme l’explique Alain Schoenenberger, chargé de cours à l’Université de Genève, qui vient d’organiser (11 et 12 juin derniers) un colloque international sur «La connaissance et diffusion des statistiques internationales», en partenariat avec le Laboratoire d’économie appliquée et l’Observatoire de la finance, le problème est particulièrement aigu dans les pays de l’Est «où l’indépendance des statisticiens n’est pas acquise». Mais il en va de même avec les organisations onusiennes, par exemple, «dont les statistiques peuvent être influencées par le politique». (Azul, Mohamed-Sghir Janjar , Lahlimi and co. lol http://www.bladi.info/199036-maroc-pays-mutation/ )

Le piège de la corrélation
Le risque de manipulation est d’autant plus grand que les statistiques sont liées à un enjeu politique. La Grèce en a fourni un bel exemple, poursuit l’économiste, lorsqu’elle a tenté, et réussi, à entrer dans l’Union économique et monétaire «en rendant impossible l’accès aux estimations statistiques à son budget». Budget au déficit abyssal, bien évidemment, comme on s’en est rendu compte quelques années plus tard!

Les statistiques du chômage font également partie de ces données sensibles. Des controverses éclatent d’ailleurs régulièrement lorsque des catégories de la population semblent disparaître comme par enchantement de la statistique. Idéalement, il faudrait avoir la possibilité de décortiquer la méthodologie retenue.

Si la statistique paraît raisonnablement honnête, on peut alors s’attacher à en examiner les constituants. C’est là un point essentiel pour en estimer la fiabilité. En effet, explique Paul Dembinski, directeur de l’Observatoire de la finance «il faut distinguer, d’une part, les données qui sont mesurables directement, et celles qui sont dérivées de modèles. Le recensement des entreprises ou de la population fait partie de la première catégorie. Le calcul du taux d’inflation ou du PIB fait partie de la seconde».

Il en découle que les statistiques basées sur la première catégorie sont beaucoup plus fiables que celles qui reposent sur la seconde catégorie. Et plus on s’éloigne des données directement mesurables, plus les statistiques deviennent sujettes à caution. «Ce qui peut poser de sérieux problèmes, comme avec le taux d’inflation, dont la marge d’erreur est de 1 à 2%», ajoute le professeur Dembinski.

Le cas extrême, c’est lorsque les statistiques sont agrégées en un seul chiffre pour permettre des classements, dont la validité est pour le moins discutable, voire «nulle» pour nos deux interlocuteurs. Mais cette production répond aux demandes du public qui veut des réponses simples à des problèmes complexes.

Lorsqu’on a bien cerné la nature d’une statistique et pu en évaluer la portée, on peut s’attacher à son interprétation. Ou, à tout le moins, à porter un regard critique sur les explications fournies par des commentateurs souvent novices en matière statistique comme s’en plaignent souvent les professionnels.

Parmi les erreurs fréquentes, on peut mentionner la confusion entre corrélation et causalité. En d’autres termes, le constat de comportements parallèles entre deux variables, c’est-à-dire de corrélation positive, incite de nombreux observateurs à induire un lien automatique de cause à effet entre les deux phénomènes. Or ce n’est souvent pas le cas, les deux variables n’ayant aucune influence l’une sur l’autre.

Source : Le Temps juillet 09
 
Retour
Haut