In lieu of an abstract, here is a brief excerpt of the content:

Chapitre 14 Données catégoriques Dans ce chapitre, nous considérons deux variables catégoriques X et Y , c’est-à-dire des variables dont la valeur n’est pas nécessairement numérique, mais peut être classifiée dans plusieurs catégories. Des exemples de telles variables comprennent : le sexe, le groupe sanguin, l’âge, la race, le niveau de revenu, l’état de propriété d’une résidence, le niveau d’éducation, etc. En utilisant un test d’hypothèse, le but est d’obtenir des preuves en faveur de l’association entre X et Y . Ceci est appelé un test d’indépendance. Nous discutons aussi le test d’homogénéité, dans lequel nous examinons plusieurs groupes qui ont subi des traitements distincts pour lesquels les résultats sont classifiés en utilisant une variable catégorique X. Dans ce cas, nous voulons obtenir des preuves qu’il y a une différence considérable entre les groupes, du point de vue de la proportion d’individus classifiés selon les catégories de la variable X. 14.1 Test d’indépendance Dans cette section, nous évaluons s’il y a une association entre deux variables catégoriques X et Y . Nous supposons que X a r classes et que Y a c classes. Chaque individu de l’échantillon est classifié selon X et Y et se situe précisément dans une classe pour chaque variable. Par exemple, si X représente le sexe et Y représente l’état de tabagisme, donc X a r = 2 classes (homme et femme) et Y a c = 2 classes (fumeur et nonfumeur ). Chaque individu est classifié dans une des 4 catégories possibles (ou cellules) : homme fumeur, femme fumeuse, homme non fumeur et femme non fumeuse. 208 Prévoir l’imprévisible – Une introduction à la biostatistique Notre but est d’obtenir des preuves qu’il existe une association entre X et Y . En tenant compte du fait que nous voulons rejeter H0, nous établissons les hypothèses : H0 : X et Y sont indépendants, H1 : il y a une association entre X et Y . Ceci est appelé un test d’indépendance. Exemple 14.1. L’objectif de l’étude [28] était d’identifier une association entre les habitudes alimentaires et le niveau d’activité physique chez les enfants du primaire en surpoids à Forth Worth, au Texas, par rapport aux normes établies par le département de l’Agriculture des États-Unis et l’Association nationale des sports et des activités physiques. Les 1 018 enfants participants ont été classifiés selon des critères variés. En particulier , ils ont été classifiés selon la race (variable X), comme 571 hispaniques et 447 afro-américains. Ces nombres étaient aléatoires, c’est-à-dire qu’il n’étaient pas fixés par les chercheurs au début de l’étude. Les enfants ont aussi été classifiés par rapport à leur poids (variable Y ) : dans le groupe d’enfants hispaniques, 105 étaient en surpoids ou à risque d’être en surpoids, tandis que dans le groupe des enfants afro-américains, 208 étaient en surpoids ou à risque d’être en surpoids. Le résumé des données se trouve dans le tableau ci-dessous. Poids normal Surpoids Total Hispanique 466 105 571 (aléatoire) Afro-américain 239 208 447 (aléatoire) Total 705 (aléatoire) 313 (aléatoire) 1 018 À partir de ces données, nous voulons déterminer s’il y a une association entre la race et le risque d’être en surpoids, pour les enfants de cette communaute ́ du Texas. Exemple 14.2. Il est connu que la distribution du groupe sanguin est différente dans chaque continent. Par exemple, la proportion de gens du groupe sanguin B est considérablement différente en Asie et en Europe. Malgré ce fait, l’association de traits de personnalité avec le groupe sanguin d’un individu est un phénomène populaire au Japon et en Corée du Sud (de façon similaire à l’association entre l’horoscope et la personnalité, dans les pays occidentaux), dont les fondations scientifiques sont encore discutables. Dans le tableau suivant, 100...

Share