In lieu of an abstract, here is a brief excerpt of the content:

CHAPITRE 3 Méthodes de l’analyse exploratoire 3.1 INTRODUCTION Jusqu’ici, nous avons présenté certains concepts exploratoires en vue d’exposer les données le mieux possible de façon graphique et de faire ressortir les principaux sommaires numériques. Il nous a été permis d’apprécier plus d’une fois l’importance de représentations graphiques ou schématiques adéquates. Le chapitre précédent a en effet initié le lecteur au diagramme en feuilles, servant à exposer l’allure générale d’une distribution de données, au diagramme en boîte, utile pour repérer les valeurs aberrantes ou comparer plusieurs paquets de données, et aux schémas des sommaires numériques garantissant une synthèse agencée des sommaires retenus. Ces outils en main, il va être possible maintenant de vivre, étape par étape, une analyse exploratoire. Celle-ci se voulant plutôt informelle, les procédures que nous présenterons au cours des prochaines sections devront être comprises comme des suggestions, sans plus. Chaque paquet de données étant unique en soi, les procédures doivent être simples, interchangeables et même doivent permettre certaines innovations à l’utilisateur. C’est dans ce contexte que le présent chapitre a été rédigé. Les concepts, méthodes et procédures présentées dans ce chapitre sont adaptées de Tukey [1977], Erickson et Nosanchuk [1977], Hartwig et Dearing [1979], Mosteller et Tukey [1977], Leinhardt et Leinhardt [1980], Leinhardt et Wasserman [1979 a], Velleman et Hoaglin [1981], Mosteller, Fienberg et Rourke [1983] et Hoaglin, Mosteller et Tukey [1983]. 3.2 MODÈLES ET PROCÉDURES Lors de l’étude exploratoire d’un ou de plusieurs paquets de données, il importe de rendre compte le plus fidèlement possible de la distribution du ou des paquets de 56 L’ANALYSE STATISTIQUE DES DONNÉES données. Il faut décrire au mieux leurs principales caractéristiques : mesure de tendance centrale, mesure de dispersion, forme (degré de symétrie, nombre de sommets), et valeurs aberrantes éventuelles. Nous avons développé au cours du dernier chapitre plusieurs outils pour mettre en évidence ces caractéristiques : le lecteur se souviendra d’outils graphiques comme le diagramme en feuilles, le diagramme en boîte, ou d’outils plus proprement numériques comme le schéma des sommaires numériques. Toutefois, comment procéder pour les mettre en valeur ? Nous voulons décrire de façon analytique, soit ! Mais par quelles caractéristiques débuter ? De quelle façon se servira-t-on des outils à notre disposition ? Quel sera le lien de cette étude exploratoire avec l’analyse confirmatoire subséquente ? La ou les réponses universellement reconnue(s) à ces questions n’existent pas. Nous ne parlerons donc pas de la procédure à suivre en analyse des données exploratoire. Par contre, une procédure peut être tentée, en tenant compte du contexte, c’est-à-dire des objectifs de l’analyse en question, des distributions de données en main, etc. C’est là un aspect sur lequel nous avons déjà attiré l’attention : en analyse exploratoire, il y a peu de lois fixes, de recettes indéfectibles, mais au contraire beaucoup de place pour le jugement (du chercheur), pour l’innovation. Ce qui a fait dire d’ailleurs que l’A.E.D. tient beaucoup de l’art1 : l’expérience pratique que l’on en fait est au moins aussi importante que son étude. Cependant, le lecteur novice en A.E.D. trouvera à n’en pas douter, dans les éléments présentés par la suite, des suggestions qui pourront grandement lui servir pour ses futurs travaux exploratoires. Nous soulignerons au passage les « suggestions » qui nous paraissent très difficilement négociables (nous avons promis « peu de lois fixes » et non« pas de loi fixe », d’accord !). Comme première suggestion (d’ailleurs entérinée par la plupart des auteurs déjà cités en A.E.D.), nous proposons un modèle général qui emploie une procédure itérative : Toute donnée sera donc considérée comme étant la résultante de deux composantes : un ajustement à une des caractéristiques déjà étudiée d’une distribution et un résidu comprenant les autres caractéristiques (non ajustées). Concrétisons un peu cette procédure itérative et ce modèle. Procédure itérative signifie pour nous une étude de chaque caract...

Share