georgy7 / russiannounsjs Goto Github PK
View Code? Open in Web Editor NEWСклонение существительных по падежам. Обычно требуются только форма в именительном падеже, одушевлённость и род.
License: MIT License
Склонение существительных по падежам. Обычно требуются только форма в именительном падеже, одушевлённость и род.
License: MIT License
У некоторых слов, которые сейчас склоняются как -ов, не должно быть окончания на самом деле.
1 склонение, мужской род.
Pluralia tantum сюда тоже относится.
Хоть библиотека и выдаёт нужную форму слова, без предлогов или дополнительной семантической информации, эту форму не получится использовать для синтеза осмысленного текста.
Получаю:
ед | множ |
---|---|
["товар"] | ["товари"] |
["товара"] | ["товар"] |
["товару"] | ["товарям"] |
["товар"] | ["товари"] |
["товаром"] | ["товарями"] |
["товаре"] | ["товарях"] |
["товаре"] | - |
Хочется исправления )))
Не знаю, как пока что. Наверно, это должно быть как-то на node.js
Слов, у которых по корпусу должно быть окончание -ньи довольно много. У меня не получилось выделить какие-то признаки, по которым их можно было бы определить.
Сейчас эти слова вываливаются в предупреждения.
http://litset.ru/stuff/21-1-0-468
Хотя это относится не к языку, а скорее к правописанию.
В ветке gh-pages есть данные из словаря OpenCorpora для определения рода, одушевленности существительного и его несклоняемости. Этот словарь компактный, там вся необходимая для алгоритма информация. Он хорош для демонстрации алгоритма.
Нужно подготовить OpenCorpora в другом формате - список склоненных форм для всех лемм. Пока что только формы в ед.ч. Расположить эти данные в другой папке. Например, OpenCorpora-Testing
. Названия файлов nouns_singular_а.json
.
И переделать страницу test так, чтобы она проверяла алгоритм по этому словарю, и показывала процент верных.
Т.к. список очень большой, лучше сделать так, чтобы показывался урезанный список (первая тысяча, например, и только буква А: эта страница потом вообще будет не нужна, ее выкинем, возможно).
Сейчас возвращается: "счет".
Должно быть "счетов/счётов".
Также пропадает буква "ё" во множественном числе.
Output:
singular: [счёт, счёта, счёту, счёт, счётом, счёте, счету]
plural: [счета, счет, счетам, счета, счетами, счетах, счетах]
Hello! I want to know when this project will migrate to ESM?
I use Deno and the workaround to support CommonJS modules is too long: you need both Deno's PM and NPM installed in one project. Not good
A declarative, efficient, and flexible JavaScript library for building user interfaces.
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
An Open Source Machine Learning Framework for Everyone
The Web framework for perfectionists with deadlines.
A PHP framework for web artisans
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
Some thing interesting about web. New door for the world.
A server is a program made to process requests and deliver data to clients.
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
Some thing interesting about visualization, use data art
Some thing interesting about game, make everyone happy.
We are working to build community through open source technology. NB: members must have two-factor auth.
Open source projects and samples from Microsoft.
Google ❤️ Open Source for everyone.
Alibaba Open Source for everyone
Data-Driven Documents codes.
China tencent open source team.