In lieu of an abstract, here is a brief excerpt of the content:

C H A P I T R E 9 La régression logistique Lorsque la variable dépendante est une variable qualitative (nominale ou ordinale), l’approche par régression «classique» telle que présentée au chapitre précédent est inadéquate. À partir de valeurs données consign ées dans les variables indépendantes, la régression classique renvoie à une estimation quantitative de la valeur dépendante. Lorsque la variable dépendante est qualitative, le problème est d’un autre ordre. La question qui se pose est la suivante: à quelle catégorie de la variable qualitative renvoient les valeurs prises par les variables explicatives? Comme on ne se situe pas dans un monde de certitude absolue, la question peut être reformulée en probabilité d’occurrence. Selon quelles probabilités les valeurs prises par les variables explicatives renvoient-elles aux différentes catégories de la variable qualitative dépendante? Les fonctions qui associent les variables explicatives aux probabilit és d’occurrence des catégories d’une variable qualitative dépendante doivent au minimum respecter certains critères. Elles doivent faire en sorte que la variable dépendante prenne ses valeurs entre 0 et 1, puisqu’il s’agit de probabilités. Elles doivent tenir compte du fait qu’elles renvoient à des catégories exhaustives et exclusives. Les probabilités relatives à l’occurrence de chaque catégorie sont soumises à la contrainte que la somme des probabilités est égale à 1. 0 L’analyse multivariée avec SPSS Diverses fonctions peuvent respecter ces critères. La fonction dite«logistique» est d’usage courant en raison de ses caractéristiques et parce qu’elle se plie relativement bien à l’estimation de ses paramètres. Trois cas seront pris en considération: • le cas où la variable dépendante qualitative comporte deux catégories exhaustives et exclusives (par exemple, s’il s’agit de vacanciers, rester à la maison ou entreprendre un voyage); • le cas où la variable dépendante qualitative nominale comporte plus de deux catégories (par exemple, résider en ville, en périph érie ou à la campagne); • le cas où la variable qualitative dépendante est ordinale (par exemple, être mécontent, indifférent ou content). Les trois cas correspondent à des situations typiques « d’analyse discriminante» (selon laquelle on cherche à prédire l’appartenance à une catégorie en fonction d’un certain nombre de caractéristiques). La régression dite «logistique» est de fait une approche privilégiée pour effectuer une analyse discriminante. On remarquera que la régression «classique» peut aussi être assimilée à une méthode d’analyse discriminante dans la mesure où il est loisible de regrouper les «prévisions» quantitatives obtenues en catégories exhaustives et exclusives. 1.VariabLe dépendante binaire et reLation Logistique Dans le cadre de la présentation de l’analyse de régression logistique binaire, nous utiliserons les données figurant au tableau suivant. La variable binaire Y: le fait d’avoir (L2 ; L2 = 1) ou de ne pas avoir (L1 ; L1 = 0) un plan d’affaires sera confrontée à deux variables indépendantes , une variable quantitative (X1 : le chiffre d’affaires par agent) et une variable qualitative binaire X2 (le chiffre 1 correspondant à l’utilisation de la publicité à la télévision et le chiffre 0, à la non-utilisation de la télévision comme support de publicité). [3.144.248.24] Project MUSE (2024-04-26 15:13 GMT) La régression logistique 0 Tableau .1 agences de voyages et pLan d’affaires PL2 représente la probabilité d’occurrence d’avoir un plan d’affaires, PL1, la probabilité de ne pas avoir de plan d’affaires. PL2 + PL1 = 1. Dès lors, PL1 = 1 – PL2 ou encore PL2 = 1 – PL1. Dès qu’on connaît une probabilité, on connaît automatiquement l’autre probabilité. Prenons arbitrairement PL2 comme point de repère. 0 L’analyse multivariée avec SPSS 1.1. repères théoriques Pour obtenir une représentation adéquate des probabilités de L2 en fonction de X1 et de X2, il s’agit d’adopter une fonction telle que toutes les valeurs prédites pour PL2 soient enfermées entre les bornes 0 et 1. Une fonction très généralement retenue pour capter ce genre de situation est la fonction logistique. Il existe bien sûr un certain arbitraire dans le choix de cette fonction. La fonction logistique n’est pas l’unique fonction possible, loin de...

Share