Giter VIP home page Giter VIP logo

Comments (4)

pbcquoc avatar pbcquoc commented on July 19, 2024

Hi e,
Hiện tại model chỉ support cho từng ảnh, em có thể gọi nhiều lần để dự đoán cho nhiều ảnh.

from vietocr.

hiendoan95 avatar hiendoan95 commented on July 19, 2024

Hi anh Quốc,
Theo em thấy trong code của hàm translate dùng để predict text có cho phép detect với batch image.
Em đã thử dùng resize để các ảnh có cùng độ cao và dùng padding để độ dài ảnh bằng nhau.

Tốc độ predict theo batch nhanh hơn predict từng ảnh (predict trên CPU với 20 ảnh nhanh hơn 20s). Tuy nhiên độ chính xác kém hơn (có thể do mô hình em train chưa được tốt).

from vietocr.

pbcquoc avatar pbcquoc commented on July 19, 2024

Mô hình a train theo batch nhưng không có padding.
Nên e thêm padding vào có thể gây ra sai nhiều hơn.

from vietocr.

anhanhtdh01 avatar anhanhtdh01 commented on July 19, 2024

I'm using Tesseract to detect texts and extract text regions. Those images have the different sizes.

How could I use the transformerOCR as the batch predicter for those images?

Hi anh Quốc,
Theo em thấy trong code của hàm translate dùng để predict text có cho phép detect với batch image.
Em đã thử dùng resize để các ảnh có cùng độ cao và dùng padding để độ dài ảnh bằng nhau.

Tốc độ predict theo batch nhanh hơn predict từng ảnh (predict trên CPU với 20 ảnh nhanh hơn 20s). Tuy nhiên độ chính xác kém hơn (có thể do mô hình em train chưa được tốt).

cho mình hỏi là predict với batch image kiểu gì ạ ??? Mình cảm ơn !

from vietocr.

Related Issues (20)

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.