Dans ce projet, nous abordons l'étude de certaines méthodes de plongement de documents (document embedding) et expérimentons une nouvelle méthode afin d'améliorer les performances des modèles de plongement de document sur des tâches de classification. Plus précisément, nous voulons calculer des embeddings de documents en pondérant des embeddings de mots. Ce travail a été réalisé par Bich-Ngoc Hoang et Pierre Prablanc.
pprablanc / doc_embedding_topic_mod Goto Github PK
View Code? Open in Web Editor NEWImproving document embedding with weighted average of word embedding through topic modeling
License: MIT License