Giter VIP home page Giter VIP logo

Comments (2)

ApelSYN avatar ApelSYN commented on July 25, 2024 2

На Русском

  1. Сначала необходимо получить примеры номеров из заданного масива фотографий автомобилей. Для этого под свои нужды можно переделать вот этот пример: https://github.com/ria-com/nomeroff-net/blob/master/tools/avto-nomer-tool/py/avto-nomer_grab.ipynb

  2. Для того чтоб создать JSON-описания к полученным образцам номеров, необходимо применить вот этот скрипт на nodejs

./console.js --section=default --action=createAnnotations  --opt.baseDir=../../datasets/ocr/your_dataset

Вот небольшая документация к этому инструментарию: https://github.com/ria-com/nomeroff-net/tree/master/tools/avto-nomer-tool

  1. Далее, можно попробовать распознать номера с помощью европейской модели, т.к. она самая универсальная для таких случаеы, пример скрипта как это делать можете посмотреть тут
    https://github.com/ria-com/nomeroff-net/blob/master/tools/avto-nomer-tool/py/ocr_dataset_checker.ipynb
    Этот пунк можно пропустить, если не разберетесь с работой этого примера.

  2. Самый трудоемкой задачей является модерация датасета, для этого мы создали спечиальную админ-панель на nodejs, документация по установке можно посмотреть тут:
    https://github.com/ria-com/nomeroff-net/tree/master/moderation

  3. Отмодерированый датасет нужно поделить на тестовую, обучающую и валидационную выборку. Это можно сделать с помощью уже упомянутого ранее набора утилит
    https://github.com/ria-com/nomeroff-net/tree/master/tools/avto-nomer-tool
    А именно

./console.js --section=default --action=dataSplit --opt.splitRate=0.2  --opt.srcDir=../../datasets/ocr/draft --opt.targetDir=../../datasets/ocr/test  
  1. Для хорошего результата обучающая выборка должна нащитывать хотя бы 5000 примеров, но мы рекомендуем 10 000

  2. Создайте скрипт, основываясь на примерах из папки train, например https://github.com/ria-com/nomeroff-net/blob/master/train/ocr-ge.ipynb и натренируйте свой датасет


In English

  1. First you need to get sample numbers from a given car photo array. To do this, you can redo this example for your needs: https://github.com/ria-com/nomeroff-net/blob/master/tools/avto-nomer-tool/py/avto-nomer_grab.ipynb

  2. In order to create JSON descriptions for the received sample numbers, you need to apply this script on nodejs

./console.js --section=default --action=createAnnotations  --opt.baseDir=../../datasets/ocr/your_dataset

Here is a little documentation for this tool: https://github.com/ria-com/nomeroff-net/tree/master/tools/avto-nomer-tool

  1. Next, you can try to recognize the numbers using the European model, because It is the most universal for such cases. You can see an example of the script here.
    https://github.com/ria-com/nomeroff-net/blob/master/tools/avto-nomer-tool/py/ocr_dataset_checker.ipynb
    Этот пунк можно пропустить, если не разберетесь с работой этого примера.

  2. The most time-consuming task is moderation dataset, for this we created a special admin panel for nodejs, installation documentation can be found here:
    https://github.com/ria-com/nomeroff-net/tree/master/moderation

  3. The moderated dataset needs to be divided into a test, training and validation sample. This can be done using the previously mentioned toolkit
    https://github.com/ria-com/nomeroff-net/tree/master/tools/avto-nomer-tool
    Example:

./console.js --section=default --action=dataSplit --opt.splitRate=0.2  --opt.srcDir=../../datasets/ocr/draft --opt.targetDir=../../datasets/ocr/test  
  1. For a good result, the training sample should contain at least 5,000 examples, but we recommend 10,000

  2. Create a script based on examples from the [train] folder (https://github.com/ria-com/nomeroff-net/blob/master/train), for example https://github.com/ria-com/nomeroff-net/blob/master/train/ocr-ge.ipynb and train your dataset

from nomeroff-net.

Paladond avatar Paladond commented on July 25, 2024

Thanks, it's a good description.

from nomeroff-net.

Related Issues (20)

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.