Abstract

English Abstract:

Librarians and archivists are increasingly collecting and working with large quantities of digital data. In science, business, and now the humanities, the production and analysis of vast amounts of data (so-called ‘big data research’) have become fundamental activities. This article introduces the project ‘A Big Data History of Music’, a collaboration between Royal Holloway, University of London and the British Library. The project has made the British Library’s catalogue records for printed and manuscript music available as open data, and has explored how the analysis and visualisation of huge numbers of bibliographic records can open new perspectives for researchers into music history. In addition to the British Library data (over a million records), the project drew on a further million bibliographic descriptions from RISM, which have also recently been released as open data. To show the challenges posed by the heterogeneous nature of the data, the article outlines the different structures of the various catalogue records used in the project, and summarises how the British Library data was cleaned and enhanced prior to its public release. Examples are given of how music-bibliographical data can be analysed and visualised, and how scholars and citizen scientists can engage with this data through hackathons, large-scale data analyses, and database construction. It is hoped this article will encourage other research libraries to consider making their catalogue records available as open data.

French Abstract:

Les bibliothécaires et les archivistes sont de plus en plus amenés à recueillir et à manipuler de grandes quantités de données numériques. Dans le domaine des sciences, des affaires et maintenant des sciences humaines, la production et l’analyse de grandes quantités de données sont devenues des activités fondamentales. Cet article présente le projet « A Big Data History of Music », une collaboration entre Royal Holloway, University of London et la British Library. Le projet a consisté à rendre disponibles sous forme de données ouvertes les notices catalographiques de la British Library pour la musique imprimée et manuscrite, et à explorer comment l’analyse et la visualisation d’un très grand nombre de notices bibliographiques peuvent ouvrir de nouvelles perspectives pour les chercheurs en histoire de la musique. En plus des données de la British Library (plus d’un million de notices), le projet a aussi tiré parti d’un autre million de descriptions bibliographiques venant du RISM, qui ont récemment été diffusées sous forme de données ouvertes. Pour montrer les défis posés par la nature hétérogène des données, l’article décrit les différentes structures des notices catalographiques utilisées dans le projet et résume la façon dont les données de la British Library ont été nettoyées et améliorées avant leur diffusion. Il comporte aussi des exemples de la façon dont les données bibliographiques relatives à la musique peuvent être analysées et visualisées, et comment les chercheurs et les scientifiques citoyens peuvent traiter ces données au moyen de marathons de programmation, d’analyses de données à grande échelle et de la construction de bases de données. Il est à espérer que cet article encouragera d’autres bibliothèques de recherche à envisager de rendre disponibles leurs notices catalographiques sous forme de données ouvertes.

German Abstract:

Bibliothekare und Archivare sammeln immer größere Mengen digitaler Daten, mit denen sie arbeiten. In den Naturwissenschaften, in der Wirtschaft und nun auch in den Geisteswissenschaften ist die Produktion und Analyse großer Datenmengen (“Big Data”) zu einer grundlegenden Tätigkeit geworden. In diesem Aufsatz wird das Gemein schaftsprojekt “A Big Data History of Music” von Royal Holloway, University of London und der British Library vorgestellt. Im Rahmen des Projektes wurden die Katalogdaten für handschriftliche und gedruckte Noten der British Library als open data verfügbar gemacht und erforscht, wie die Analyse und optische Aufbereitung einer immensen Menge bibliografischer Daten den Forschern neue Perspektiven auf die Musikgeschichte eröffnen. Zusätzlich zu den mehr als eine Million Datensätzen der British Library benutzte das Projekt eine weitere Million bibliografischer Beschreibungen aus RISM, die kürzlich als open data zur Verfügung gestellt wurden. Im Artikel werden die unterschiedlichen Strukturen der Datensätze aus den verschiedenen Katalogen beschrieben, um die daraus resultierenden Herausforderungen aufzuzeigen. Außerdem wird zusammengefasst dargestellt, wie die Daten der British Library vor der Veröffentlichung bereinigt und angereichert wurden. Beispiele illustrieren, wie musikbibliografische Daten analysiert und visualisiert werden können und wie Studenten und Wissenschaftler durch die Arbeit in Hackathons, mit großformatiger Datenanalyse sowie mit Datenbankentwicklung aus diesen Daten Nutzen ziehen können. Vorbildhaft soll dieser Aufsatz andere wissenschaftliche Bibliotheken ermuntern, ihre Katalogdaten als open data zur Verfügung zu stellen.

pdf

Additional Information

ISSN
2471-156X
Print ISSN
0015-6191
Pages
pp. 67-88
Launched on MUSE
2016-04-12
Open Access
No
Back To Top

This website uses cookies to ensure you get the best experience on our website. Without cookies your experience may not be seamless.