mèche perceuse

 

 

 

 

 

 

 

 

 

 

 Sorties de logiciels : indépendance du khi²

La page que vous avez le bonheur de consulter présente des sorties de logiciels sur un exemple simple. Dans le cadre d’un scoring d’acceptation pour un crédit d’acquisition de produits électroménagers, on observe une population de 1 933 demandeurs en fonction de quatre tranches d’âge et du critère accepté vs refusé (variable DEC). Existe-t-il un lien entre ces tranches d’âges (variable quantitative considérée comme qualitative) et la décision ?

acceptés / refusés

Coupons court au suspense, le χ² est égal à 40,186 avec (4 – 1)(2 – 1) = 3 degrés de liberté. La valeur de la probabilité associée au test est donc quasi nulle (9,7 . 10-9). Pas d’hésitation possible : c’est avec un certain enthousiasme qu’on rejette l’hypothèse nulle, ce nombre étant largement inférieur au 0,05 usuel… Il y a donc bien une « discrimination » sur l’âge. Le χ² et toutes les statistiques complémentaires ci-dessous trouveraient toutefois leur pleine utilité en comparant ce tableau avec un autre, dans lequel les tranches d’âges seraient un peu différentes (ceci pour savoir si un autre découpage laisserait envisager une grille de score plus discriminante).

Excel : après avoir entré le tableau ci-dessus, il convient de construire vous-même le tableau des valeurs théoriques… (voir comment en page test d’indépendance du khi²). Placez-vous ensuite sur une cellule vierge et appelez la fonction TEST.KHIDEUX. Vous entrez ensuite les deux plages de valeurs, observées et théoriques, et Excel vous donne la p-value associée au test. Inférieure à 0,05 ? Vous avez détecté une liaison !

SAS : devant l’étendue des possibilités de SAS, on se contentera d’observer la sortie d’une proc freq avec l’option / chisq.

Je passe sur le tableau qui inclut effectifs, pourcentages du total, en lignes et en colonnes pour me rendre directement au résultat.

STATISTICS FOR TABLE OF AGE BY DEC


Statistic                                            DF          Value                    Prob

Chi-Square                                       3             40.186                  0.000
Likelihood Ratio Chi-Square       3             40.454                  0.000
Mantel-Haenzel Chi-Square         1             35.411                  0.000
Phi Coefficient                                                  0.144
Contingency Coefficient                                0.143
Cramer’s V                                                        0.144

Statgraphics Centurion : procédure Tri croisé si les données ne sont pas déjà sous forme de tableau puis procédure Tableaux de contingence. En sortie : tableau des effectifs, histogrammes, le test du χ², des statistiques résumées et les rapports des chances estimés et risques relatifs. Avec pour chaque rapport un petit commentaire explicatif. Je ne détaille ci-dessous que le rapport « Statistiques résumées » sans les commentaires associés.

Statistique Symétrique Avec lignes  Avec colonnes 
dépendantes dépendantes
Lambda 0,0524 0,0000 0,1079
Coeft d’incertitude 0,0113 0,0090 0,0151
D de Somer -0,1339 -0,1546 -0,1181
Eta 0,1440 0,1442  

 

Statistique Valeur Probabilité Ddl
Coeft de contingence          0,1427      
V de Cramer          0,1442      
Gamma conditionnel -       0,2346      
R de Pearson -       0,1440   0,0000 1931
Tau b de Kendall -       0,1351   0,0000  
Tau c de Kendall -       0,1546      

Tanagra : nécessite d’entrer les données en liste. Je n’ai pas indiqué les sorties dans la mesure où d’autres exemples de restitutions du χ² données par ce logiciel libre sont indiquées sur ce site (voir test d’indépendance du khi²). Signalons les particularités suivantes : tableau de contingence avec cases colorées en rouge lorsque leur contribution est deux fois plus élevée que la contribution moyenne, statistiques relativement complètes (T de Tschuprows, U de Theil…).

XLSTAT : beaucoup d’informations. Statistiques habituelles du χ² puis du G² de Wilks (le Likelihood Ratio Chi-Square de SAS). Un χ² peut en outre être estimé par la méthode de Monte Carlo. Les mesures d’association sont les suivantes :

Sorties Xlstat

D’autres mesures apparaissent dans des cas particuliers de tableaux ayant le même nombre de lignes que de colonnes (Kappa de Cohen) ou de tableaux 2 × 2 (Q de Yule, Y de Yule, odds ratio, log odds ratio). Le tableau de contingence est restitué sous de nombreuses formes, y compris graphiques.

Sans logiciel (mais avec internet) : voir page test de la médiane.

 

liaison

plus de livres (France)    plus de livres (Canada)