-
Chapitre 6 Tests d'hypothèses sur l'irrégularité des séquences de nombres
- Presses de l'Université du Québec
- Chapter
- Additional Information
Tests d'hypothèses sur l'irrégularité des séquences de nombres 6.1 La méthode Monte Carlo utilise des nombres aléatoires à la manière d'un combustible, afin de vitaliser un modèle structurel ou de reproduire la variété échantillonnale de données d'observation. Elle s'apparente en cela aux techniques de statistique inférentielle, pour lesquelles les « données » sont réputées être des réalisations d'une variable aléatoire issues d'une loi de probabilité, très souvent la loi normale. Pour appliquer la méthode Monte Carlo, dans l'une ou l'autre de ses variantes, et pour en obtenir des conclusions valides ou des estimations justes, les nombres utilisés doivent être statistiquement adéquats, c'est-à-dire qu'ils doivent présenter les propriétés d'une variable aléatoire à distribution connue. Cependant, comme on l'a vu au chapitre 4, les diverses distributions s'obtiennent ordinairement à partir de la distribution uniforme; il suffit donc souvent de valider la source de nombres aléatoires uniformes en vérifiant que les v.a. ul produites constituent des séquences de v.a. indépendantes et de distribution U(0,1). 6.2 Le test des propriétés de distribution pour des séries de nombres déborde largement le seul cadre des applications de la méthode Monte Carlo. Des scientifiques de toutes disciplines se sont demandé, à propos d'observations, si celles-ci étaient apparues en ordre fortuit, si elles évoluaient au hasard ou, généralement, si, d'une façon ou d'une autre, elles juraient avec le comportement attendu de v.a. indépendantes. Certains tests ont été faits pour, ou même par, des chercheurs en psychologie, en biologie, en agronomie. Dans ces cas, la distribution de référence n'est plus uniquement la loi uniforme, voire cette distribution n'est pas même spécifiée, ce qui donne lieu à des tests dits a-distributionnels (Bradley 1968) ou non paramétriques (Lehmann 1975). Les tests de normalité, enfin, constituent une classe à part: ils aident à décider si une série statistique donnée répond ou non à la forme de la distribution normale. Leur application la plus courante concerne les tests d'hypothèse de type fishérien, qui utilisent l'une ou l'autre des lois normale, t, x2 et F. Dans ce contexte, les tests de normalité servent à valider la Chapitre §6.3 Hasard, nombres aléatoires et méthode Monte Carlo 92 condition de distribution normale imposée à la variable de base. Une excellente revue de ces tests se trouve dans Mardia (1980). Nous nous penchons sur ces tests au paragraphe §6.11. 6.3 Ii s'agit donc, à partir d'une séquence de nombres, d'un groupe de valeurs successivement produites par un générateur mécanique ou issues d'observations, de déterminer si l'hypothèse du hasard est tenable: étant donné telle séquence de n nombres, l'hypothèse nulle voulant que ces nombres proviennent d'une source purement aléatoire, à loi de distribution spécifiée, est-elle plausible? La question ainsi posée peut donner lieu à une série de tests statistiques, chacun traitant un aspect particulier du comportement attendu de la variable aléatoire. Chaque test porte sur la séquence de nombres et permet de se prononcer sur l'irrégularité locale de la source, par opposition à son irrégularité globale (voir §2.12). Le test, effectué sur une séquence, peut être « significatif » ou non. Il s'agit d'abord de bien identifier la distribution échantillonnale du test, c'est-àdire la loi probabiliste qui gouverne la variation de son résultat lorsque les données proviennent d'une source purement aléatoire. Puis, on établit la probabilité extrême, pext' du résultat observé; celle-ci est définie comme la probabilité (sous l'hypothèse d'une variation au hasard pur) d'un résultat égal au résultat observé ou d'un plus éloigné encore de la valeur centrale. Étant donné un seuil de signification a (0 50. soit la valeur maximale de la différence absolue entre les deux f.r., multipliée par √n. La probabilité extrême de Dn est, asymptotiquement, pext = 1 - 2•exp (-2Dn2 ), ce qui fournit les valeurs critiques 1,358 et 1,628 pour les seuils a de 0,05 et 0,01 respectivement. Ces...