Cet article s’attache à décrypter la présence diégétique des protagonistes romanesques à travers l’analyse quantitative de leur apparition dans un vaste corpus de textes. Il propose une typologie des structures narratives révélant des dynamiques sous-jacentes, tout en interrogeant les limites des outils numériques dans la désambiguïsation des entités nommées. Il esquisse enfin des perspectives pour le traitement automatique du langage, visant à affiner l’identification et l’analyse des personnages.
This article aims to unravel the diegetic presence of characters in novels by quantitatively analyzing their appearances across a broad text corpus. It develops a typology of narrative structures that expose underlying dynamics and examines the limitations of digital tools in clarifying named entities. The paper concludes by suggesting future directions for natural language processing to enhance the identification and analysis of characters.
