In lieu of an abstract, here is a brief excerpt of the content:

Introduction C H A P I T R E 1 Introduction La compilation se situe au tout début de l’informatique parce qu’elle ne demande que le travail le plus simple que peut demander l’arithmétique, celui de compter : pas un mot du calcul infinitésimal, ou d’autres formules qui s’appuient sur une théorie préalable ! Tout au contraire, en principe le travail de la compilation est tellement simple que même une tabulatrice mécanique peut y répondre. Si nous utilisons l’ordinateur, c'est pour profiter de sa rapidité électronique, et non à cause de la nature inhérente du travail. Par contre, si un dernier chapitre utilisera certaines formules de la corrélation, ce ne sera que dans un esprit d’économie, pour ainsi dire : étant donné l’état final de nos tableaux, on peut en obtenir certaines valeurs clés pratiquement sans coût additionnel. Ayant alors ces valeurs sous la main, on peut en calculer par exemple la corrélation, mais dans un sens strict, cette dernière relève de la statistique descriptive plutôt que de la compilation. On en verra quelques raisons ci-dessous. Pour le moment, notons d’abord que le simple travail de compter peut quand même exiger l’intervention de l’ordinateur, et ceci, à cause de la multitude et de la multiplicité des données à compiler. La multitude comprend le fait simple du grand nombre de données, nombre qui peut facilement atteindre des proportions dépassant ce qu’on peut raisonnablement aborder par un travail manuel ou mécanique -- même s’il ne s’agit que d’un simple comptage. D’autre part, la multitude implique presque toujours la multiplicité (ou la diversité) des cas : on ne veut rarement que compter les réponses, mais en les comptant, on veut aussi les répartir selon leurs diverses caractéristiques, et en principe rien ne s’y oppose. En pratique, cependant, on s’aperçoit d’une explosion rapide de l’espace demandé même par une petite étude. L’explosion se produit comme suit : si une première répartition est désirable, la deuxième le sera encore davantage. Répartissons alors la répartition, ensuite la répartition des répartitions, et ainsi de suite... Par exemple, supposons qu’on vient de déterminer les caractéristiques que voici d’une population, à savoir : Lieu, Grandeur de la famille, Âge, et Revenu, et ceci, en acceptant jusqu’à 10 codes par critère. Alors il faudra 100 cases pour un tableau qui tiendra compte de Ville et Famille simultanément (plus précisément, 10 colonnes pour les divers Lieux, et 10 lignes, une pour chaque code pertinent à Grandeur de la famille). Si ce même tableau doit aussi considérer l'âge du répondant, on obtient déjà 1000 cases (c’est-à-dire les 100 cases du tableau Ville/Famille dix fois, une fois pour chaque groupe d’âge). Et l’inclusion d’un quatrième facteur en fait 10*10*10*10 ou 10000 cases au total ! On va reprendre ce problème de l’explosion de l’espace en développant les programmes appropriés, et on va proposer un remède. Cependant, il est clair qu’une méthode naive Introduction 2 de compilation arrivera rapidement à construire des tableaux dépassant la capacité même d'un ordinateur moderne. Autrement dit, le problème initial ne demande que le simple comptage -- mais il faut quand même une méthode sophistiquée pour le traduire d’une façon pratique aussi bien que révélatrice, et ceci, tout en conservant l’avantage du traitement interactif : le client devrait être capable de spécifier une répartition-tableau quelconque, sans aucune contrainte de nature quantitative, en obtenant le résultat presque instantanément, et de sorte qu'il puisse approfondir un aspect intéressant sur-le-champ. Le programme TAB répond à ce besoin. Regardons en quelques sorties afin de mieux apprécier les divers types de tableaux. Par exemple, le tableau que voici donne le résultat d'une toute première compilation de 200 réponses obtenues dans le contexte d'une recherche démographique -Le tableau dit non seulement qu’il y avait 200 réponses (résultat qu’on peut aussi facilement établir par un comptage manuel), mais sa valeur réside plutôt dans le fait qu’il répartit...

Share