L’intention de ce projet est de développer et mettre en œuvre des compétences de prétraitement de texte et des techniques d’extraction de features spécifiques aux données non structurées de type texte dans le but de détecter des sujets d’insatisfaction évoqués par des clients dans leurs avis postés sur les sites d’avis client comme (TripAdvisor). Le projet couvre tout le cycle de mise en place d’une preuve de concept, du prétraitement des données jusqu’au déploiement.
L’objectif de cette premiére partie est de recueillir un jeu de données nettoyé et constitué de ses mots les plus essentiels et les plus représentatifs. Nous identifierons la spécificité des données texte, en ce sens qu’elles sont rarement exploitables sous leur forme brute. L’objectif de cette deuxiéme partie est de transformer le jeu de données textuel en données numériques puis utiliser ces données pour détecter les topics émergent du jeu de données. L’objectif de cette troisiéme partie est de développer une application web s’executant en local et permettant de prédire le sujet d’insatisfaction à partir d’un texte libre si l’avis exprimé dans le texte est négatif. L’objectif de cette quatriéme partie est de déployer dans le cloud, l’application web locale qui a été développée et testée précédemment. Cette partie nécessitera la création d’un compte sur Streamlit Cloud.yasmineoueslati / jalon_1_nlp Goto Github PK
View Code? Open in Web Editor NEWL’objectif de cette première partie est de recueillir un jeu de données nettoyé et constitué des mots les plus essentiels et les plus représentatifs et l'identification de la spécificité des données texte, en ce sens qu’elles sont rarement exploitables sous leur forme brute.