Giter VIP home page Giter VIP logo

tradutor_libras's Introduction

Tradutor de Libras

Objetivo

O Tradutor de Libras é um projeto do PET Computação que visa ajudar os membros a aprenderem e aplicarem modelos de previsão, bem como ajudar de incentivo ao aprendizado de Libras.

Metodologia

O projeto foca na previsão de sinais do alfabeto de Libras que não exigem movimento (ou seja, todas as letras, excluindo H, J, K, X e Z).

O dataset foi coletado pelos próprios membros do PET e voluntários.

Esse projeto foi fortemente inspirado nesse repositório: https://github.com/computervisioneng/sign-language-detector-python

Instalando bibliotecas necessárias

sudo apt install python3-pip
pip3 install -U scikit-learn
sudo apt-get install python3-opencv
pip install mediapipe

Como usar

Caso queira apenas usar a aplicação diretamente, siga esses passos:

Criando dataset base

Os dados do projeto estão separados por pessoa, e o primeiro passo é juntá-los em apenas um arquivo. Execute o código "merge_data.py":

python3 datasets/merge_data.py

Os dados serão salvos no arquivo "datasets/base_dataset.pickle".

Separando dados de treino e teste

Para ser possível treinar o modelo e posteriormente testá-lo, é necessário fazer o split dos dados Execute o código "merge_data.py":

python3 models/create_split.py

Os dados serão salvos na pasta "models/TrainTestData".

Treinando o modelo

O melhor modelo dentro os analisados deve ser criado para ser utilizado na aplicação. Execute o código "create_best_model.py":

python3 models/create_best_model.py

O modelo está salvo no arquivo "models/best_model.sav".

Criando a aplicação

Cria a aplicação que irá acessar a câmera e analisar os sinais feitos e tentar prevê-los. Execute o código "application.py":

python3 ./application.py

Algumas dicas

Dependendo da máquina, os comando acimas podem usar "python" ou "python3".



Nos arquivos que usam câmera, pode ser necessário mudar o argumento do cv2.VideoCapture. Para a maioria das máquinas, usar 0 como argumento deve funcionar, mas dependendo da situação pode ser necessário usar outros valores (por exemplo, se tiver mais de uma câmera ligada ao sistema). Nesses casos, 1 ou 2 como argumento devem funcionar.

Dificuldades com Python -> Vale ressaltar a existência do material do curso básico da linguagem dentro do repositório do PET e a gravação da aula com o material nos arquivos do projeto.

tradutor_libras's People

Contributors

robertotomchak avatar gabriellisboaconegero avatar mateusherbele avatar

Stargazers

Cauan Victor avatar Allan Araújo avatar Tiago Serique avatar Pedro avatar  avatar Edu avatar  avatar Eduardo Gillung avatar Anderson Frasão avatar Vinícius avatar Juliana Zambon avatar

Watchers

 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.