jamesasj / jcorretorortografico Goto Github PK
View Code? Open in Web Editor NEWThis project forked from giullianomorroni/jcorretorortografico
Biblioteca Java para análise ortográfica de palavras, implementação para dicionário em portugês (pt_BR). Dado um texto o programa irá validar e quando necessário sugerir palavras corretas (estilo: você quis dizer....) A biblioteca implementa dois tipos de análises, uma proposta por Peter Norvig (http://norvig.com/spell-correct.html) e outra análise baseada no algoritimo de Levenshtein (https://en.wikipedia.org/wiki/Levenshtein_distance) Possui uma base de dados com 600k palavras (zipadas) que são lidas apenas na inicialização da biblioteca na JVM. A busca por palavras exatas é feita através de BinarySearch em dicionários separados pela inicial da palavra (esses dicionários ficam em memória e também são carregados uma única vez).
License: Apache License 2.0