Les statistiques peuvent tromper celui qui ne sait pas les lire
On est en droit de sinterroger sur la validité des informations statistiques, ainsi que de linterprétation quon peut leur donner. Car celles-ci ont une bien mauvaise réputation, comme sen amusait déjà Mark Twain il y a plus dun siècle: «Il y a trois sortes de mensonges: les mensonges, les sacrés mensonges et les statistiques.»
PLUS DE MENSONGES EN SUIVANT :
Sans aller aussi loin que lhumoriste américain, on doit pourtant se montrer circonspect à légard de toute information, chiffrée ou non. On doit ainsi à chaque fois se poser quelques questions. Dune part, il sagit dessayer dévaluer le degré dhonnêteté de la statistique. Autrement dit, de savoir quelle est lindépendance des statisticiens par rapport aux commanditaires de leurs recherches. Et, de manière corollaire, de sintéresser aux intérêts particuliers des bailleurs de fonds, pour estimer le risque de manipulation et de son ampleur potentielle. Dautre part, il faut analyser la structure de la statistique pour en évaluer la fiabilité. Enfin, il faut soumettre toute interprétation, surtout si elle est hâtive, à la plus grande rigueur critique.
Concrètement, comme lexplique Alain Schoenenberger, chargé de cours à lUniversité de Genève, qui vient dorganiser (11 et 12 juin derniers) un colloque international sur «La connaissance et diffusion des statistiques internationales», en partenariat avec le Laboratoire déconomie appliquée et lObservatoire de la finance, le problème est particulièrement aigu dans les pays de lEst «où lindépendance des statisticiens nest pas acquise». Mais il en va de même avec les organisations onusiennes, par exemple, «dont les statistiques peuvent être influencées par le politique». (Azul, Mohamed-Sghir Janjar , Lahlimi and co. lol http://www.bladi.info/199036-maroc-pays-mutation/ )
Le piège de la corrélation
Le risque de manipulation est dautant plus grand que les statistiques sont liées à un enjeu politique. La Grèce en a fourni un bel exemple, poursuit léconomiste, lorsquelle a tenté, et réussi, à entrer dans lUnion économique et monétaire «en rendant impossible laccès aux estimations statistiques à son budget». Budget au déficit abyssal, bien évidemment, comme on sen est rendu compte quelques années plus tard!
Les statistiques du chômage font également partie de ces données sensibles. Des controverses éclatent dailleurs régulièrement lorsque des catégories de la population semblent disparaître comme par enchantement de la statistique. Idéalement, il faudrait avoir la possibilité de décortiquer la méthodologie retenue.
Si la statistique paraît raisonnablement honnête, on peut alors sattacher à en examiner les constituants. Cest là un point essentiel pour en estimer la fiabilité. En effet, explique Paul Dembinski, directeur de lObservatoire de la finance «il faut distinguer, dune part, les données qui sont mesurables directement, et celles qui sont dérivées de modèles. Le recensement des entreprises ou de la population fait partie de la première catégorie. Le calcul du taux dinflation ou du PIB fait partie de la seconde».
Il en découle que les statistiques basées sur la première catégorie sont beaucoup plus fiables que celles qui reposent sur la seconde catégorie. Et plus on séloigne des données directement mesurables, plus les statistiques deviennent sujettes à caution. «Ce qui peut poser de sérieux problèmes, comme avec le taux dinflation, dont la marge derreur est de 1 à 2%», ajoute le professeur Dembinski.
Le cas extrême, cest lorsque les statistiques sont agrégées en un seul chiffre pour permettre des classements, dont la validité est pour le moins discutable, voire «nulle» pour nos deux interlocuteurs. Mais cette production répond aux demandes du public qui veut des réponses simples à des problèmes complexes.
Lorsquon a bien cerné la nature dune statistique et pu en évaluer la portée, on peut sattacher à son interprétation. Ou, à tout le moins, à porter un regard critique sur les explications fournies par des commentateurs souvent novices en matière statistique comme sen plaignent souvent les professionnels.
Parmi les erreurs fréquentes, on peut mentionner la confusion entre corrélation et causalité. En dautres termes, le constat de comportements parallèles entre deux variables, cest-à-dire de corrélation positive, incite de nombreux observateurs à induire un lien automatique de cause à effet entre les deux phénomènes. Or ce nest souvent pas le cas, les deux variables nayant aucune influence lune sur lautre.
Source : Le Temps juillet 09
On est en droit de sinterroger sur la validité des informations statistiques, ainsi que de linterprétation quon peut leur donner. Car celles-ci ont une bien mauvaise réputation, comme sen amusait déjà Mark Twain il y a plus dun siècle: «Il y a trois sortes de mensonges: les mensonges, les sacrés mensonges et les statistiques.»
PLUS DE MENSONGES EN SUIVANT :
Sans aller aussi loin que lhumoriste américain, on doit pourtant se montrer circonspect à légard de toute information, chiffrée ou non. On doit ainsi à chaque fois se poser quelques questions. Dune part, il sagit dessayer dévaluer le degré dhonnêteté de la statistique. Autrement dit, de savoir quelle est lindépendance des statisticiens par rapport aux commanditaires de leurs recherches. Et, de manière corollaire, de sintéresser aux intérêts particuliers des bailleurs de fonds, pour estimer le risque de manipulation et de son ampleur potentielle. Dautre part, il faut analyser la structure de la statistique pour en évaluer la fiabilité. Enfin, il faut soumettre toute interprétation, surtout si elle est hâtive, à la plus grande rigueur critique.
Concrètement, comme lexplique Alain Schoenenberger, chargé de cours à lUniversité de Genève, qui vient dorganiser (11 et 12 juin derniers) un colloque international sur «La connaissance et diffusion des statistiques internationales», en partenariat avec le Laboratoire déconomie appliquée et lObservatoire de la finance, le problème est particulièrement aigu dans les pays de lEst «où lindépendance des statisticiens nest pas acquise». Mais il en va de même avec les organisations onusiennes, par exemple, «dont les statistiques peuvent être influencées par le politique». (Azul, Mohamed-Sghir Janjar , Lahlimi and co. lol http://www.bladi.info/199036-maroc-pays-mutation/ )
Le piège de la corrélation
Le risque de manipulation est dautant plus grand que les statistiques sont liées à un enjeu politique. La Grèce en a fourni un bel exemple, poursuit léconomiste, lorsquelle a tenté, et réussi, à entrer dans lUnion économique et monétaire «en rendant impossible laccès aux estimations statistiques à son budget». Budget au déficit abyssal, bien évidemment, comme on sen est rendu compte quelques années plus tard!
Les statistiques du chômage font également partie de ces données sensibles. Des controverses éclatent dailleurs régulièrement lorsque des catégories de la population semblent disparaître comme par enchantement de la statistique. Idéalement, il faudrait avoir la possibilité de décortiquer la méthodologie retenue.
Si la statistique paraît raisonnablement honnête, on peut alors sattacher à en examiner les constituants. Cest là un point essentiel pour en estimer la fiabilité. En effet, explique Paul Dembinski, directeur de lObservatoire de la finance «il faut distinguer, dune part, les données qui sont mesurables directement, et celles qui sont dérivées de modèles. Le recensement des entreprises ou de la population fait partie de la première catégorie. Le calcul du taux dinflation ou du PIB fait partie de la seconde».
Il en découle que les statistiques basées sur la première catégorie sont beaucoup plus fiables que celles qui reposent sur la seconde catégorie. Et plus on séloigne des données directement mesurables, plus les statistiques deviennent sujettes à caution. «Ce qui peut poser de sérieux problèmes, comme avec le taux dinflation, dont la marge derreur est de 1 à 2%», ajoute le professeur Dembinski.
Le cas extrême, cest lorsque les statistiques sont agrégées en un seul chiffre pour permettre des classements, dont la validité est pour le moins discutable, voire «nulle» pour nos deux interlocuteurs. Mais cette production répond aux demandes du public qui veut des réponses simples à des problèmes complexes.
Lorsquon a bien cerné la nature dune statistique et pu en évaluer la portée, on peut sattacher à son interprétation. Ou, à tout le moins, à porter un regard critique sur les explications fournies par des commentateurs souvent novices en matière statistique comme sen plaignent souvent les professionnels.
Parmi les erreurs fréquentes, on peut mentionner la confusion entre corrélation et causalité. En dautres termes, le constat de comportements parallèles entre deux variables, cest-à-dire de corrélation positive, incite de nombreux observateurs à induire un lien automatique de cause à effet entre les deux phénomènes. Or ce nest souvent pas le cas, les deux variables nayant aucune influence lune sur lautre.
Source : Le Temps juillet 09