In lieu of an abstract, here is a brief excerpt of the content:

CHI carré 79 C H A P I T R E 10 Évaluation statistique Le CHI carré et le CHI L’objectif principal des chapitres précédents était de compter combien de fois une réponse particulière fut donnée. Ainsi, dans l’illustration intiale, on a constaté les faits suivants concernant la question, « Où habitez-vous ? » : Ville + Aville Bville Cville Dville + Somme Fréquence + 3 4 2 1 + 10 Pourcentage + 30 40 20 10 + 100 Il faut maintenant évaluer la signification statistique de ces résultats et ensuite les présenter d'une façon qui permet de trouver immédiatement les aspects importants. Concernant la signification statistique, il faut décider si les observations sont réprésentatives de la population. Par exemple, dans le cas des fréquences 3, 4, 2 et 1, peut-on supposer que l’échantillon reflète la population véritable ? En fait, cette dernière se répartit à 20 %, 40 %, 20 % et 20 %. Une façon de répondre à cette question est de prendre les fréquences de la population véritable, et ensuite de comparer ces fréquences avec celles qui ont été observées. La première étape de cette comparaison est de répartir les fréquences attendues pour en obtenir le même total que celui des fréquences observées lors du sondage. Ensuite on détermine les différences entre les deux comme le fait l’exemple qui suit : La ligne P, « population véritable », s’explique par le fait que l’exemple ne comprend que 10 épreuves. Alors, si ces 10 répondants se répartissent selon la distribution supposée, il devait y en avoir 20 % de 10 ou 2 à Aville, 40 % de 10 ou 4 à Bville, etc. En fait, on a compté 3 personnes à Aville, ce qui fait donc une différence de D = F – P = 3 – 2 = 1. Par contre, on trouve les valeurs attendues à Bville et Cville, tandis qu’il manque une personne à Dville. Quand il s’agit d’apprécier la signification de ces différences, on est naturellement porté à les voir dans une perspective relative : Une personne de trop à Aville, est-ce peu ou beaucoup ? C’est peu si on s’attend à voir un grand nombre de personnes dans cette ville, mais s’il devrait y avoir seulement 2, alors 1/2 fait 50 %. En règle générale, Ville + A B C D + Somme F, Observé + 3 4 2 1 + 10 P, Véritable + 2 4 2 2 + 10 D= (F - P) + 1 0 0 –1 + 0 CHI carré 80 D % = (F - P) /P, écart relatif entre « observé » et « attendu » D % indique alors le pourcentage par lequel la fréquence observée dépasse la valeur attendue. Dans le cas de l’exemple, on obtient une différence relative de 50 % pour Avilie et Dville, de 0 pour Bville et Cville, et il apparaît que le sondage concernant la distribution de la population sur les quatre villes donne une variation moyenne de MD % = (50 + 0 + 0 + 50)/4 = 100/4 = 25 %, différence moyenne Une appréciation intuitive peut s’arrêter là, en résumant la différence entre les fréquences attendues et les fréquences observées par la moyenne de la variation relative. Cependant, le lecteur se demandera si la valeur ainsi obtenue est une valeur stable : Si on examine un autre échantillon de ce même processus, aura-t-on la même variation relative, ou alors sera-t-elle plus ou moins forte ? En particulier, peut-elle être plus grande ? C’est la grande variation qui importe parce qu'elle cause l’incertitude concernant la signification du résultat. Une façon de répondre à cette question est de pondérer les différences déjà observées, et ceci, en accordant une plus grande importance aux écarts excessifs. Autrement dit, on fait pondérer un petit écart par un poids faible, et un grand écart par un poids fort (parce qu’un grand écart observé suggère la possibilité des écarts encore plus grands parmi toutes les épreuves qu’on peut prélever). On peut réaliser cette idée dune façon aussi simple que pratique en élevant chaque différence au carré, ainsi la pondérant par elle-même. Ainsi la différence de 1 de notre exemple reste à 1, mais on accorde un poids de 4 à une différence de 2. La formule...

Share