Abstract

Abstract:

Automatic clickbait detection is a relatively novel task in natural language processing (NLP) and machine learning (ML). "Clickbait" is a hyperlink created primarily to attract attention to its target content. This article introduces a binary classifier, the Language and Information Technology Research Lab (LiT.RL, pronounced "literal") Clickbait Detector, which automatically distinguishes clickbait from non-clickbait. We used NLP and ML for 38 textual features, contrasting clickbait with "headlinese." When tested on 11,000 hyperlinks, it achieves 94 per cent accuracy using a support vector machine. Integrated with the LiT.RL News Verification Browser, a downloadable stand-alone research tool, the Clickbait Detector user interface shows automated real-time colour-coded analysis of any news website.

Résumé:

La détection automatique de pièges à clics est relativement nouvelle dans le traitement naturel du langage (TNL) et en apprentissage automatique (AO). Le piège à clics est un lien hypertexte créé surtout pour attirer l'attention vers son contenu cible. Cet article introduit un classifiant binaire, le détecteur de pièges à click Language and Information Technology Research Lab (LiT.RL), qui distingue automatiquement les pièges des non-pièges. Nous utilisons le TNL et l'AO sur 38 caractéristiques textuelles, contrastant les pièges à clics et de titres accrocheurs. Nous avons testé 11 000 liens hypertextes et avons obtenu un score de 94 pour cent d'exactitude en utilisant une machine à vecteurs de support. Intégrée au fureteur de vérification de nouvelles LiT.RL, un outil autonome de recherche téléchargeable, l'interface usager du détecteur de pièges à clics montre une analyse en temps réel qui utilise un code de couleur de tout site Web de nouvelles.

pdf

Share