A Sentiment-Based Digital Library of Movie Review Documents Using Fedora / Une bibliothèque numérique de documents critiques de films basée sur les sentiments en utilisant Fedora
Abstract

Abstract:

This study develops a digital library of movie review documents that supports sentiment-based browsing and searching. Firstly, we develop an automatic method for in-depth sentiment analysis and classification of movie review documents to provide sentiment orientations toward multiple perspectives of movies, such as overall opinion about the movie, director, and cast. By utilizing information extraction techniques such as entity extraction, co-referencing, and pronoun resolution, the review texts are segmented into multiple sections where each section contains multiple sentences and discusses a particular aspect of the reviewed movie. For each aspect section, a machine-learning algorithm, Support Vector Machine (SVM), is applied to determine sentiment orientation toward the target aspect. Secondly a prototype digital library is developed with the automatically analysed data to show the usefulness of sentiment-based browsing and searching. Using the system, the user can browse and search movies by sentiment polarity (positive, neutral, or negative) of multiple aspects in the movie. Finally, a usability evaluation is conducted to observe the effectiveness of the sentiment-based digital library.

Résumé:

Cette étude examine le développement d’une bibliothèque numérique de documents critiques de films permettant l’exploration et la recherche par sentiments. Pour commencer, nous développons une méthode automatique pour l’analyse en profondeur des sentiments et la classification des documents critiques de films propres à fournir des orientations à propos des sentiments capables d’offrir des perspectives multiples sur les films, comme par exemple l’opinion générale sur le film, sur le metteur en scène, et sur les acteurs. Grâce à l’utilisation de techniques d’extraction d’information telles que l’extraction d’entités, le co-référencement, et la résolution de pronoms, les comptes rendus sont segmentés en de multiples sections où chacune contient plusieurs phrases et aborde un aspect particulier du film en question. À chacune de ces sections on applique un algorithme d’apprentissage automatique, Support Vector Machine (SVM), qui détermine l’orientation du ou des sentiments pour cette section. Ensuite, nous développons un prototype de bibliothèque numérique en utilisant les données analysées automatiquement afin de montrer l’utilité de l’exploration et de la recherche par sentiments. En utilisant ce système, l’utilisateur peut explorer et faire des recherches dans les films selon les polarités des sentiments (positif, neutre, ou négatif) et ce, sur de nombreux aspects des films. Pour finir, nous avons effectué une évaluation d’utilisabilité afin de vérifier l’efficacité d’une bibliothèque numérique basée sur les sentiments.