In lieu of an abstract, here is a brief excerpt of the content:

C H A P I T R E 7 Analyse bivariée Corrélation et régression simple Les instruments d’exploration de données empiriques se diversifient et s’affinent lorsque les deux variables sont quantitatives. On les utilisera, par exemple, pour examiner à partir d’une base de données la relation entre la variable «salaire» et la variable «années de scolarité». La représentation graphique, la corrélation, la régression simple sont ici généralement privil égiées. Les trois approches sont en pratique indissociables, la corrélation explorant la relation entre deux variables en supposant qu’elles sont liées par une relation «linéaire». 1.La CorréLation biVariée simpLe (CorréLation de pearson) Pour présenter la corrélation bivariée simple (corrélation de Pearson) et sa relation à la régression simple, on fera appel à un fichier de données (Fecond.xls sous forme Excel; Fecond.sav sous forme SPSS) qui exploite 1 L’analyse multivariée avec SPSS des informations provenant du rapport annuel 2003 du PNUD. Pour un certain nombre de pays, les taux de fertilité «Fertility Rate» (Y) seront confrontés au nombre (X) de médecins par 100 000 habitants. Le graphique suivant laisse entrevoir une régularité entre Y et X. Figure .1 taux de fertiLité et nombre de médecins par 100 000 habitants dans différents pays d’après le rapport du pNud 2003| | | | | | 0,00 50,00 100,00 150,00 200,00 250,00 X 8,00 – 7,00 – 6,00 – 5,00 – 4,00 – 3,00 – 2,00 – Y 1.1. repères théoriques La corrélation bivariée simple (corrélation de Pearson) tente de donner une synthèse de la régularité que l’on devine dans le graphique en supposant qu’une droite est capable de «rassembler» au mieux («le plus près possible de la droite») les divers points du graphique. Le coefficient de corrélation simple prend ses valeurs à l’intérieur de l’intervalle –1 et +1. –1 ≤ r ≤ 1 [18.188.20.56] Project MUSE (2024-04-26 04:57 GMT) Analyse bivariée – Corrélation et régression simple 13 Le signe positif ou négatif du coefficient de corrélation (r) correspond à l’orientation de la pente de la droite autour de laquelle se regroupent les divers points du nuage de points. Figure . La reLation Linéaire sous-jacente à La corréLation simpLe 50 40 30 20 10 0 r = 0,82 40 35 30 25 20 15 10 5 0 7 12 17 22 7 12 17 22 r = –1 Le coefficient ne prend sa signification que pour des ensembles de données susceptibles d’être résumées graphiquement autour d’une droite. La figure 7.1 des données (Yi, Xi) évoque une situation dont la régularité risque d’échapper partiellement au coefficient de corrélation linéaire simple. L’expression qui définit le coefficient de corrélation linéaire est la suivante: r X X Y Y X X Y Y i n i i i n i i n i = ( )( ) ( ) ( ) = = = ∑ ∑ ∑ 1 1 2 1 2 – – – – Les deux tableaux suivants permettent de suivre le détail du calcul du coefficient de corrélation (r). 1 L’analyse multivariée avec SPSS Tableau .1 détaiLs du caLcuL du coefficient de corréLation simpLe (première partie) Analyse bivariée – Corrélation et régression simple 1 Tableau . détaiLs du caLcuL du coefficient de corréLation (deuxième partie) Y Y N i = ( ) ∑ / X X N i = ( ) ∑ / ∑ y x i i ∑ yi 2 ∑ xi 2 4,62 47,68 –3119,21 110,47 164610,21 ∑ yi 2 ∑ xi 2 10,51 405,72 r x y x y i i i i = = ∑ ∑ ∑ 2 2 0 731 – , 1.2. commandes spss et Le traitement d’un exempLe Pour accéder au calcul du coefficient de corrélation en SPSS, on procède comme suit: En sélectionnant bivariate, on fait apparaître une nouvelle fenêtre qu’on peut compléter comme indiqué ci-dessous: Figure .3 commandes spss pour La corréLation bivariée : fenêtre principaLe [18.188.20.56] Project MUSE (2024-04-26 04:57 GMT) 1 L’analyse multivariée avec SPSS Dans la nouvelle fenêtre, «Y», «X», «lnfecond», «lnmed» ont été introduits sous le terme VariableS (N.B.: on aurait pu introduire plus de variables). Les...

Share