In lieu of an abstract, here is a brief excerpt of the content:

CHAPITRE 2 Concepts de l’analyse exploratoire 2.1 INTRODUCTION Depuis plusieurs années, il existe un nombre croissant de volumes de statistique appliquée à l’usage des chercheurs en psychologie et en éducation. Certains se veulent des ouvrages d’introduction, tandis que d’autres se consacrent à l’étude d’analyses hautement spécialisées. Ils partagent cependant un certain nombre de caractéristiques : ils exposent une multitude (le formules, bien souvent au moyen d’une notation assez complexe pour le néophyte, s’attaquent à la démonstration des théorèmes les plus importants en statistique et contiennent un nombre plus ou moins important d’exemples. On trouve peu de graphiques dans (le tels volumes. Cependant, la personne qui a consulté fréquemment ces ouvrages ne peut qu’être interloquée devant le volume Exploratory data analysis de John W. Tukey, publié en 1977. Ce livre est en effet totalement différent des manuels décrits plus haut : contenant un nombre assez faible de formules, il fourmille par contre de diagrammes aux noms vaguement exotiques, comme le diagramme en feuilles ou le diagramme en boîte. Tukey consacre même une page à critiquer le traditionnel papier quadrillé pour faire ses suggestions quant au papier qu’il convient le mieux d’utiliser (p. 42). La première réaction consiste bien souvent à se demander s’il s’agit bien là d’un « vrai livre de statistique » ! De fait, le volume de Tukey marque une révolution dans le domaine en proposant une distinction entre les phases exploratoire et confirmatoire de l’analyse des données. Pourquoi ? Parce qu’il ne se contente pas uniquement de proposer une nouvelle orientation théorique ou même de plaider en faveur de l’exploration, mais il offre de nouveaux concepts, de nouvelles méthodes, un nouveau vocabulaire et une nouvelle logique simple, visuelle et intuitive. La place des graphiques dans cette approche est particulièrement importante. La qualité d’un graphique utile lors d’une analyse exploratoire réside dans ses 24 L’ANALYSE STATISTIQUE DES DONNÉES possibilités de faire découvrir à l’analyste des caractéristiques étranges, des phénomènes inattendus, voire même des hypothèses novatrices à partir des données. Mosteller et Tukey [1968, p. 113] désignent cette propriété intéressante d’un graphique, le « aha ». Ceci signifie qu’une personne qui regarde le graphique hoche la tête et dit a aha » ! Elle vient de constater quelque chose ! Tout cela fait partie de la nouvelle philosophie propre à l’analyse exploratoire : il s’agit, pour l’analyste, de scruter ses données, de les représenter visuellement, de les explorer et ce, de façon autonome avec des outils aussi simples que possible sans être à la remorque de quelque programme ou progiciel informatique. Une grande partie du travail s’effectue à la main, avec papier et crayon ou encore avec calculatrice de poche ou avec micro-ordinateur. Les outils utilisés sont résistants aux valeurs dites aberrantes, c’est-à-dire les valeurs qui ne sont pas conformes aux autres données. Des valeurs aberrantes sont souvent présentes surtout lorsque le plan de la recherche n’est pas très rigoureux (comme c’est quelquefois le cas en éducation). Or les outils de l’analyse exploratoire ne sont pas ou peu influencés par ces quelques valeurs. Les sections qui suivent constituent une première sensibilisation aux principaux concepts employés en analyse exploratoire. Nous nous sommes inspirés principalement des travaux de Tukey [1977], Velleman et Hoaglin [1981], Hartwig et Dearing [1979], Erickson et Nosanchuk [1977], Mosteller et Tukey [1968], Leinhardt et Leinhardt [1980], Wainer et Thissen [1981], et Hoaglin, Mosteller et Tukey [1983]. 2.2 LES SOMMAIRES NUMÉRIQUES Comme nous l’avons vu au chapitre précédent, l’analyse exploratoire est une approche très différente de l’analyse confirmatoire, et comporte en conséquence un vocabulaire et des concepts bien particuliers. Pour débuter, on nomme paquet de données un ensemble de données regroupées selon une propriété commune. On peut citer par exemple les résultats à un examen de français pour une classe de sixième primaire, le nombre d’étudiants de chaque classe de cinquième secondaire d’une commission scolaire régionale ayant réussi l’examen de physique de fin d’année, ou la fréquence des questions posées par chacun des 25 enseignants d’un groupe expérimental...

Share