Nous avons précédemment parlé dans la séquence N°9 du Test statistique de Chi-deux. Notre partage de cette semaine se tournera sur la Dixième séquence portant sur la corrélation des variables continue.
La corrélation est souvent utilisée pour mesurer la force ou l'intensité entre une variable indépendante quantitative et une variable dépendante quantitative. Elle permet également d’inférer l'existence d'une corrélation au sein de la population d’étude.
Corrélation
1. Dans le menu Analyse, se trouve la corrélation. Sous Corrélation, choisissez Bivariée pour effectuer une corrélation entre deux variables. Concernant la corrélation partielle, elle tient compte d'une variable contrôle.
2. Dans la boite de dialogue principale, insérez, à l'aide de la flèche, les variables continues à tester dans la boite Variables.
Vous avez la possibilité d’évaluer la relation entre deux ou plusieurs variables continues à la fois. Puisque nous nous intéressons ici des relations simples, nous n’insérons que deux variables.
3. Vous avez le choix entre trois coefficients de corrélation :
- Pearson (par défaut) : coefficient calculé pour des variables continues
- Kendall's tau-b et Spearman : ces tests sont des mesures non-paramétriques. Le coefficient est calculé pour des variables catégorielles ordinales.
4. Vous avez aussi la possibilité de déterminer le type de test d'hypothèse à vérifier. Si l'hypothèse de recherche indique clairement dans quel sens va l'association, vous pouvez choisir le test unilatéral, sinon, vous laissez l'option par défaut du test bilatéral.
5. Il est conseillé de laisser coché l'option Repérer les corrélations significatives pour que SPSS les mette en évidence par des astérisques.
6. Pour finir votre processus, cliquer sur OK.
7. Les options offertes avec la corrélation se résument à deux choses : les moyennes et écart-types pour chacune des variables que vous testez ainsi que le produit des écarts et covariances.
8. Concernant les valeurs manquantes, vous avez deux possibilités dont l’une vous permet d’exclure les valeurs manquantes du calcul du coefficient pour chaque paire de variables (Exclure seulement les composantes non valides), ou l’autre d’exclure de tous les calculs toutes les valeurs manquantes pour l'ensemble des variables testées (Exclure toute observation incomplète).
9. Et enfin, vous cliquez ensuite sur OK pour terminer votre opération.
Résultat de la corrélation
Dans cet exemple, nous avons réalisé une corrélation entre le nombre d’œuf consommé par fréquence et le prix d’achat d’œuf à partir de notre base de données. Nous désirions savoir s'il existait une relation linéaire significative entre ces deux variables.
Le tableau de corrélation obtenu est assez simple à interpréter. Il s'agit d'un tableau croisé entre les variables mises en relation.
Il suffit donc de voir dans chaque case présentant le croisement de deux variables la valeur du coefficient accompagné d'astérisques si la corrélation est significative et non accompagné d'astérisques si la corrélation n’est pas significative, le degré de signification qui y est associé et le nombre d'observations qui ont été croisées.
Nous remarquons que la corrélation n’est pas significative, nous pouvons donc accepter l'hypothèse nulle d'absence de relation entre le nombre d’œuf consommé par fréquence et le prix d’achat d’œuf. Ceci signifie que la probabilité d'obtenir un coefficient de cette taille dans une population où ces deux variables ne sont pas reliées est de plus de 5 % (P=Sig>0,05). Nous rejetons l'hypothèse alternative: il n’existe donc pas une relation linéaire négative (puisque le coefficient est négatif, C=-0,314) entre les deux variables.
Martin ZONOU, et toute l’équipe IRMD Africa