(1) L’explication causale en sciences sociales

4 minute read

Published:

De 2011 à 2013, je suivais des cours de sociologie et d’économie à l’ENS Cachan. On avait en particulier quelques cours de méthodes, notamment un sur les méthodes qualitatives (surtout les entretiens et les observations sur le terrain) et un autre sur les méthodes quantitatives, où on y apprenait surtout à manier R (un logiciel de statistiques) et à faire des régressions et des ACM (analyses en composantes principales). Je me rappelle avoir été sujet à une certaine confusion concernant l’utilisation de ces outils quantitatifs, en particulier la régression. Je ne comprenais pas par quelle magie la régression arrivait à nous donner des conclusions intéressantes. Cela m’a poursuivi encore quelques années. Avec le recul, je me rends compte qu’il nous manquait une compréhension de base de ce que c’est que d’expliquer causalement. Ma confusion était due aux problèmes inhérents à la vision de la régression qu’on nous enseignait.

Ceci est le premier post d’une série sur les régressions et l’inférence causale en sciences sociales, où je vais parler de cette vision, de ses problèmes, et de comment on peut faire mieux. Pour faire court, je pense que la vision qu’on m’a enseignée devrait être abandonnée, ou du moins profondément corrigée à la lumière de la littérature grandissante sur l’inférence causale.
Dans ce premier post, je commence par poser les bases de l’explication et la causalité en sciences sociales quantitatives.

Quand on fait des sciences sociales, on ne veut pas seulement décrire le monde, on veut aussi l’expliquer. On ne se contente pas de constater que la deuxième guerre mondiale a eu lieu ou qu’il y a des inégalités de revenus entre différents groupes – par exemple entre hommes et femmes – on cherche aussi à les expliquer, et donc à répondre à la question « pourquoi ?». Et souvent, on répond à cette question en identifiant des causes. Par exemple, on pourra essayer d’expliquer le déclenchement de la deuxième guerre mondiale en pointant vers des causes hypothétiques comme l’esprit de revanche allemand, le krach boursier de 1929, ou les réparations exigées par les vainqueurs de la première guerre mondiale.

Mais qu’est-ce qu’une cause, en fait ? C’est une question difficile. On peut commencer par dire qu’une cause doit se produire avant sa conséquence et que la conséquence « dépend » (en un certain sens) de sa cause. On peut aussi adopter un point de vue anthropocentrique en suggérant que la marque de la causalité, c’est qu’une intervention exogène sur la cause doit modifier son effet1. Dire que le krach boursier de 1929 est une cause de la deuxième guerre mondiale impliquerait que si on revenait dans le passé en 1929 et qu’on arrivait à prévenir le krach boursier, la deuxième guerre mondiale n’aurait pas eu lieu. La causalité concerne ce qui aurait pu se passer, c’est-à-dire à ce qu’on appelle en philosophie la contrefactualité. On parle d’énoncés contrefactuels pour désigner les énoncés au conditionnel du genre : «  si c’était le cas que…, alors… ».

Le problème avec les énoncés contrefactuels, c’est que – par définition – on ne peut pas directement les vérifier. On a pu observer les conséquences du krach boursier de 1929, mais on n’a pas pu observer ce qui se serait passé s’il n’avait pas eu lieu. L’expérimentation est justement un moyen de pallier cette difficulté fondamentale en permettant de créer des conditions dans lesquelles on manipule, dans un environnement contrôlé (par exemple un laboratoire), des phénomènes pour constater les effets qu’ils ont. Quand on expérimente, on « simule », pour ainsi dire, des conditions contrefactuelles.
Bien sûr, c’est plus difficile à faire pour des événements historiques qui ne se produisent qu’une seule fois, comme la deuxième guerre mondiale ! C’est un problème récurrent en sciences sociales, où on ne peut pas toujours aisément tester nos hypothèses via l’expérimentation. Si je constate que les femmes sont en moyenne payées moins que les hommes, comment savoir si c’est causé par le fait de travailler dans des secteurs d’activité différents, des prétentions salariales différentes, de la discrimination à l’embauche, etc. ?

Et bien, les sciences sociales ont d’autres outils à disposition pour découvrir des relations causales. La suite dans le prochain post !

  1. C’est le message principal de la théorie philosophique développée par Woodward (2003)