Ditch the Smileys: Customizing a Stopword List for Email-based Data
DOI:
https://doi.org/10.29173/cais394Abstract
The study uses grounded theory approach to develop different categories of stopwords leading to the creation of a stopword list for email-based data. The finding of the study will contribute in better understanding of email as data and developing better algorithms which could automatically remove specific category of stopwords.
Cette étude se base sur la théorie à base empirique pour développer différentes catégories de mots vides qui seront utilisés pour créer une liste aux fins d'analyse des données issues de courriels. Les résultats permettront une meilleure compréhension des courriels comme source de données et la création de meilleurs algorithmes de suppression automatique de catégories précises de mots vides.