Trabalho desenvolvido para a conclusão da graduação em Biomedicina com enfase em informática de saúde pela Universidade Positivo 2021.
Autores
-Guilherme Cardoso de Vargas
-Patrícia Ferreira Vieira
-Marianna Boia Ferreira (Orientadora)
O diagnóstico precoce das neoplasias cutâneas é uma das estratégias mais utilizadas para detectar lesões malignas em suas fases iniciais, possibilitando uma maior chance de tratamento. Na última década as ferramentas de bioinformática e ferramentas computacionais têm sido fundamentais para auxiliar no diagnóstico e na tomada de decisões, contribuindo para o diagnóstico complementar e elevando a probabilidade de um diagnóstico preciso. Desta forma o objetivo deste trabalho foi desenvolver um modelo capaz de classificar cânceres e lesões de pele, como uma ferramenta de auxílio diagnóstico, utilizando as imagens dermatoscópicas. Para o desenvolvimento do algoritmo, utilizamos imagens dermatoscópicas de Nevos melanocíticos (nv),Melanoma (mel), Lesões tipo ceratose benigna (bkl), Carcinoma basocelular (bcc), Ceratoses actínicas (akiec), Lesões vasculares (vas) e Dermatofibroma (df), da base de dados HAM10000. A rede neural foi desenvolvida na linguagem Python em conjunto com o framework TensorFlow.Durante o treinamento foi possível observar 97% de acurácia e erro (loss) de 0.078, já nos dados de validação 85% de acurácia e erro de 0.308. Ao final com os dados de teste que o modelo nunca tinha visto antes obtivemos um erro de 1.029 e acurácia de 74%, apresentando um bom desempenho na classificação de NV, lesões BCC e VASC. O modelo apresentou uma acurácia considerável, demonstrando o potencial das CNN na tarefa de classificação de imagens dermatoscópicas, porém sendo necessário um número de dados maior ou a utilização de outras técnicas como imagens termográficas permitindo com que o modelo consiga generalizar melhor os dados.
Durante o treinamento do modelo foi possível observar 97% de acurácia e erro (loss) de 0.078, já nos dados de validação 85% de acurácia e erro de 0.308. Ao final com os dados de teste que o modelo nunca tinha visto antes obtivemos um erro de 1.029 e acurácia de 74%. O modelo aparentemente se ajustou bem aos dados de treinamento, porém podendo indicar um certo overfitting em decorrência do aumento dos dados sem tantas transformações nas imagens. Acurácia elevada quando comparado com os dados de teste pode ter se dado ao fato de termos uma maior variabilidade de alguns tipos de cânceres e lesões em nossos dados, a outros pequenos ajustes que podem ser necessários realizar na arquitetura e/ou nos otimizadores do modelo. Obviamente o modelo apresentou um ótimo desempenho na classificação de NV, isso pode se dar pelo fato da alta variabilidade de imagens disponíveis para este tipo de lesão. A classificação de lesões BCC e VASC também apresentaram precision e f1-score com valores consideráveis mesmo com um número de amostras baixas no caso de lesões VASC.
EM DESENVOLVIMENTO