Abstract

Abstract:

Automatic clickbait detection is a relatively novel task in natural language processing (NLP) and machine learning (ML). "Clickbait" is a hyperlink created primarily to attract attention to its target content. This article introduces a binary classifier, the Language and Information Technology Research Lab (LiT.RL, pronounced "literal") Clickbait Detector, which automatically distinguishes clickbait from non-clickbait. We used NLP and ML for 38 textual features, contrasting clickbait with "headlinese." When tested on 11,000 hyperlinks, it achieves 94 per cent accuracy using a support vector machine. Integrated with the LiT.RL News Verification Browser, a downloadable stand-alone research tool, the Clickbait Detector user interface shows automated real-time colour-coded analysis of any news website.

Résumé:

La détection automatique de pièges à clics est relativement nouvelle dans le traitement naturel du langage (TNL) et en apprentissage automatique (AO). Le piège à clics est un lien hypertexte créé surtout pour attirer l'attention vers son contenu cible. Cet article introduit un classifiant binaire, le détecteur de pièges à click Language and Information Technology Research Lab (LiT.RL), qui distingue automatiquement les pièges des non-pièges. Nous utilisons le TNL et l'AO sur 38 caractéristiques textuelles, contrastant les pièges à clics et de titres accrocheurs. Nous avons testé 11 000 liens hypertextes et avons obtenu un score de 94 pour cent d'exactitude en utilisant une machine à vecteurs de support. Intégrée au fureteur de vérification de nouvelles LiT.RL, un outil autonome de recherche téléchargeable, l'interface usager du détecteur de pièges à clics montre une analyse en temps réel qui utilise un code de couleur de tout site Web de nouvelles.

pdf

Additional Information

ISSN
1920-7239
Print ISSN
1195-096X
Pages
pp. 154-175
Launched on MUSE
2019-12-13
Open Access
Yes
Archive Status
Archived 2021
Back To Top

This website uses cookies to ensure you get the best experience on our website. Without cookies your experience may not be seamless.