Comments (2)
На Русском
-
Сначала необходимо получить примеры номеров из заданного масива фотографий автомобилей. Для этого под свои нужды можно переделать вот этот пример: https://github.com/ria-com/nomeroff-net/blob/master/tools/avto-nomer-tool/py/avto-nomer_grab.ipynb
-
Для того чтоб создать JSON-описания к полученным образцам номеров, необходимо применить вот этот скрипт на nodejs
./console.js --section=default --action=createAnnotations --opt.baseDir=../../datasets/ocr/your_dataset
Вот небольшая документация к этому инструментарию: https://github.com/ria-com/nomeroff-net/tree/master/tools/avto-nomer-tool
-
Далее, можно попробовать распознать номера с помощью европейской модели, т.к. она самая универсальная для таких случаеы, пример скрипта как это делать можете посмотреть тут
https://github.com/ria-com/nomeroff-net/blob/master/tools/avto-nomer-tool/py/ocr_dataset_checker.ipynb
Этот пунк можно пропустить, если не разберетесь с работой этого примера. -
Самый трудоемкой задачей является модерация датасета, для этого мы создали спечиальную админ-панель на nodejs, документация по установке можно посмотреть тут:
https://github.com/ria-com/nomeroff-net/tree/master/moderation -
Отмодерированый датасет нужно поделить на тестовую, обучающую и валидационную выборку. Это можно сделать с помощью уже упомянутого ранее набора утилит
https://github.com/ria-com/nomeroff-net/tree/master/tools/avto-nomer-tool
А именно
./console.js --section=default --action=dataSplit --opt.splitRate=0.2 --opt.srcDir=../../datasets/ocr/draft --opt.targetDir=../../datasets/ocr/test
-
Для хорошего результата обучающая выборка должна нащитывать хотя бы 5000 примеров, но мы рекомендуем 10 000
-
Создайте скрипт, основываясь на примерах из папки train, например https://github.com/ria-com/nomeroff-net/blob/master/train/ocr-ge.ipynb и натренируйте свой датасет
In English
-
First you need to get sample numbers from a given car photo array. To do this, you can redo this example for your needs: https://github.com/ria-com/nomeroff-net/blob/master/tools/avto-nomer-tool/py/avto-nomer_grab.ipynb
-
In order to create JSON descriptions for the received sample numbers, you need to apply this script on nodejs
./console.js --section=default --action=createAnnotations --opt.baseDir=../../datasets/ocr/your_dataset
Here is a little documentation for this tool: https://github.com/ria-com/nomeroff-net/tree/master/tools/avto-nomer-tool
-
Next, you can try to recognize the numbers using the European model, because It is the most universal for such cases. You can see an example of the script here.
https://github.com/ria-com/nomeroff-net/blob/master/tools/avto-nomer-tool/py/ocr_dataset_checker.ipynb
Этот пунк можно пропустить, если не разберетесь с работой этого примера. -
The most time-consuming task is moderation dataset, for this we created a special admin panel for nodejs, installation documentation can be found here:
https://github.com/ria-com/nomeroff-net/tree/master/moderation -
The moderated dataset needs to be divided into a test, training and validation sample. This can be done using the previously mentioned toolkit
https://github.com/ria-com/nomeroff-net/tree/master/tools/avto-nomer-tool
Example:
./console.js --section=default --action=dataSplit --opt.splitRate=0.2 --opt.srcDir=../../datasets/ocr/draft --opt.targetDir=../../datasets/ocr/test
-
For a good result, the training sample should contain at least 5,000 examples, but we recommend 10,000
-
Create a script based on examples from the [train] folder (https://github.com/ria-com/nomeroff-net/blob/master/train), for example https://github.com/ria-com/nomeroff-net/blob/master/train/ocr-ge.ipynb and train your dataset
from nomeroff-net.
Thanks, it's a good description.
from nomeroff-net.
Related Issues (20)
- Failed to run get-started-demo.py in docker container HOT 3
- обучать пользовательский набор данных HOT 7
- I have error about checkpoint HOT 5
- KeyError: 'pytorch-lightning_version' HOT 3
- How to train OCR model? HOT 3
- ImportError: cannot import name 'efficientnet_v2_s' from 'torchvision.models' HOT 1
- when change name of folder nomer_net code not work HOT 5
- Size of docker image HOT 1
- Multiline example doesn't return correct recognitions
- draw rectangle bbox on plate HOT 4
- Некорректное распознавание российских номер с регионом 799, 977 HOT 1
- Некорректное распознавание номеров в 3 строки
- Ошибка при установке пакета в req.txt HOT 1
- Columns and DataType Not Explicitly Set on line 157 of datasets_tools.py
- Error in nomeroff-net setup command: 'install_requires' HOT 1
- Label 'md' not in dict_keys && Label changed on default 'eu_ua_2015'
- Realtime Video performance / Benchmrk
- Getting OCR score
- Performance question
- Is it possible to run nomeroff in multiprocessing mode?
Recommend Projects
-
React
A declarative, efficient, and flexible JavaScript library for building user interfaces.
-
Vue.js
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
-
Typescript
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
-
TensorFlow
An Open Source Machine Learning Framework for Everyone
-
Django
The Web framework for perfectionists with deadlines.
-
Laravel
A PHP framework for web artisans
-
D3
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
-
Recommend Topics
-
javascript
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
-
web
Some thing interesting about web. New door for the world.
-
server
A server is a program made to process requests and deliver data to clients.
-
Machine learning
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
-
Visualization
Some thing interesting about visualization, use data art
-
Game
Some thing interesting about game, make everyone happy.
Recommend Org
-
Facebook
We are working to build community through open source technology. NB: members must have two-factor auth.
-
Microsoft
Open source projects and samples from Microsoft.
-
Google
Google ❤️ Open Source for everyone.
-
Alibaba
Alibaba Open Source for everyone
-
D3
Data-Driven Documents codes.
-
Tencent
China tencent open source team.
from nomeroff-net.