Contributions aux axes factoriels
Les aléas de la vie vous ont conduit à réaliser une analyse factorielle (ACP sur variables, ACP sur individus, AFC, ACM). Et là, vous vous trouvez seul(e), face à de mystérieux axes factoriels. Et cette question existentielle qui martèle votre esprit : « pourquoi eux ? »
Bon, un peu de sérieux.
Des contributions inégales
Dans un espace de variables, certaines sont plus importantes que d’autres pour expliquer l’inertie d’un facteur. Leur contribution est donc forte. Il est moins fréquent d’observer les contributions des individus car ceux-ci sont généralement trop nombreux. En revanche, s’ils ne sont qu’une vingtaine, on remarque que quelques outliers expliquent davantage la direction d’un axe que des individus « moyens ».
C’est pourquoi les sorties de logiciels incluent souvent des tableaux de contributions aux axes qui constituent des aides efficaces à l’interprétation. Il y en a deux :
Les contributions absolues montrent dans quelle mesure la direction d’un axe est expliquée par un point : c’est, pour un axe donné, la proportion d’inertie qui est attribuée à telle ligne ou telle colonne du tableau de données.
Les contributions relatives permettent de juger la qualité de représentativité d’un point vis-à-vis d’un axe. Géométriquement, tout point de l’espace considéré forme un triangle rectangle avec sa projection sur l’axe et avec l’origine. L’éloignement du point peut donc être mesuré par son cosinus carré. Si la représentation est parfaite, le point se confond avec l’axe, l’angle est nul et le \(\cos^2\) est égal à 1.
Les fortes contributions et les \(\cos^2\) proches de 1 sont des éléments susceptibles d’attribuer une signification à un axe. Si dans le cadre d’une étude de marché on nomme un axe « sensibilité à la publicité », c’est peut-être parce qu’on a trouvé à ses extrémités des individus présentant des \(\cos^2\) très élevés et que ce sont précisément ces répondants qui ont donné, parmi les nombreuses questions d’une enquête, les réponses les plus tranchées aux questions concernant la publicité.
Exemple
Les deux tableaux suivants, issus de XLSTAT, résultent de l’exemple d’une ACP sur les observations (données sur quelques groupes américains). On y constate aisément qu’un outlier (General Motors) explique près des deux tiers de l’inertie du premier axe. Le point qui le représente graphiquement est d’ailleurs presque sur l’axe, le \(\cos^2\) étant très élevé.
Pour trouver la signification du premier axe, il suffit de se reporter aux données et de trouver ce qui distingue General Motors des autres sociétés. La signification du deuxième axe est surtout fournie par Exxon et Wal Mart. Celle du troisième axe est donnée de façon plus diffuse par Citigroup et General Electric mais on remarque que Home Depot se situe presque sur l’axe (\(\cos^2 = 0,854\)) et, si ce n’est pas cette société qui explique le plus d’inertie, elle est la plus « typique ». Les sociétés sont toutes éloignées des axes suivants, en particulier du dernier qui ne contient plus aucune explication…
Autre exemple, celui d’une AFC sur les variables. L’exemple est celui de la page Résultats d’une AFC.
Là encore, on remarque que l’essentiel de l’inertie est expliqué par un critère, en l’occurrence le bleu. Les poids des autres couleurs ne sont pas pour autant insignifiants mais les modalités semblent dispersées de façon presque aléatoire…