Giter VIP home page Giter VIP logo

usure's Introduction

Usure

La herramienta USURE permite la creación de las representaciones, la experimentación y evaluación de ellas en diferentes tipos de clasificadores.

Esta herramienta brinda una facilidad para el desarrollo de la experimentación, permitiendo ahorrar tiempo y recursos. Se espera que pueda servir y agregar valor en trabajos futuros de estudiantes o cualquier otra persona interesada en el tema.

El nombre clave del proyecto o herramienta es \say{Usure} (Úsure) y como dato curioso, representa la casa cósmica de los aborígenes Bribri de Costa Rica.

Descripción de la aplicación Usure

La aplicación Usure se encuentra dividida en tres paquetes (Python) principales, pero la conceptualización lógica que se le da a estos paquetes para efectos del proyecto es de aplicación. Las tres aplicaciones son \textit{preprocessing, wordvectors} y classification. Estas aplicaciones cuentan con responsabilidades específicas que se mencionan a continuación.

La aplicación de preprocesamiento preprocessing se encarga de transformar los corpus existentes. Esta aplica funciones de transformación a cada uno de los comentarios de un corpus. Además, almacena en forma persistente el resultado de estas transformaciones en archivos con extensión ".usu".

La aplicación wordvectors, recibe como insumo los archivos ".usu", los cuales representan el corpora preprocesado. Se encarga de crear las representaciones vectoriales de las palabras y persistirlas, por medio del framework Gensim, que a su vez es el en cargado de generar estas representaciones. Cabe destacar que la arquitectura permite desacoplar el framework de vectorización de forma fácil. En este caso se utilizó Gensim pero este puede ser sustituido por otro, como por ejemplo fastText.

La aplicación classification, es la encargada de generar y evaluar los modelos, teniendo como insumo cualquier corpus (en este proyecto el corpus InterTASS_CR) y las representaciones vectoriales generadas por la aplicación wordvectors.

El paquete classification, sirve como punto de referencia para describir la estructura interna de las tres aplicaciones. Los principales paquetes que se pueden encontrar en estas aplicaciones son: el core, donde reside la lógica del negocio, infrastructure, que representa los accesos a recursos externos o ajenos a la lógica del negocio, como por ejemplo la persistencia; y por último se tiene ui que representa el paquete de interfaz de usuario. Utilizándose aquí Jupyter, una aplicación HTML para visualización y ejecución de código.

usure's People

Contributors

coraxcr avatar panumo avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.