Comments (4)
Hi e,
Hiện tại model chỉ support cho từng ảnh, em có thể gọi nhiều lần để dự đoán cho nhiều ảnh.
from vietocr.
Hi anh Quốc,
Theo em thấy trong code của hàm translate dùng để predict text có cho phép detect với batch image.
Em đã thử dùng resize để các ảnh có cùng độ cao và dùng padding để độ dài ảnh bằng nhau.
Tốc độ predict theo batch nhanh hơn predict từng ảnh (predict trên CPU với 20 ảnh nhanh hơn 20s). Tuy nhiên độ chính xác kém hơn (có thể do mô hình em train chưa được tốt).
from vietocr.
Mô hình a train theo batch nhưng không có padding.
Nên e thêm padding vào có thể gây ra sai nhiều hơn.
from vietocr.
I'm using Tesseract to detect texts and extract text regions. Those images have the different sizes.
How could I use the transformerOCR as the batch predicter for those images?
Hi anh Quốc,
Theo em thấy trong code của hàm translate dùng để predict text có cho phép detect với batch image.
Em đã thử dùng resize để các ảnh có cùng độ cao và dùng padding để độ dài ảnh bằng nhau.Tốc độ predict theo batch nhanh hơn predict từng ảnh (predict trên CPU với 20 ảnh nhanh hơn 20s). Tuy nhiên độ chính xác kém hơn (có thể do mô hình em train chưa được tốt).
cho mình hỏi là predict với batch image kiểu gì ạ ??? Mình cảm ơn !
from vietocr.
Related Issues (20)
- Cannot pickle 'Environment' object HOT 4
- Extend Vocab HOT 2
- Error: train_hw: There is not enough space on the disk.
- Can we train VietOCR model for Japanese language ? HOT 2
- AttributeError: 'Delaunay' object has no attribute 'vertices' HOT 5
- lỗi load config HOT 1
- Có vấn đề khi sử dụng batch predict. HOT 1
- TypeError: 'Predictor' object is not callable
- Lỗi khi training custom dataset HOT 1
- Lỗi không chạy được sau khi cài HOT 4
- Predict trên 1 dataset lớn HOT 1
- Valid loss lớn hơn Training loss HOT 1
- Remove n invalid images HOT 2
- New PIL not AttributeError: module 'PIL.Image' has no attribute 'ANTIALIAS' HOT 6
- Load dataset HOT 6
- Augmentation Issues HOT 1
- Có thể giới hạn được các kí tự đầu ra không?
- Chào a, cảm ơn a vì đã đóng góp sản phẩm này cho cộng đồng,
- Thắc mắc về đầu vào Image, Acc per char HOT 1
- Can not create dataset on Jupyter Notebook because of [tab] definition HOT 1
Recommend Projects
-
React
A declarative, efficient, and flexible JavaScript library for building user interfaces.
-
Vue.js
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
-
Typescript
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
-
TensorFlow
An Open Source Machine Learning Framework for Everyone
-
Django
The Web framework for perfectionists with deadlines.
-
Laravel
A PHP framework for web artisans
-
D3
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
-
Recommend Topics
-
javascript
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
-
web
Some thing interesting about web. New door for the world.
-
server
A server is a program made to process requests and deliver data to clients.
-
Machine learning
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
-
Visualization
Some thing interesting about visualization, use data art
-
Game
Some thing interesting about game, make everyone happy.
Recommend Org
-
Facebook
We are working to build community through open source technology. NB: members must have two-factor auth.
-
Microsoft
Open source projects and samples from Microsoft.
-
Google
Google ❤️ Open Source for everyone.
-
Alibaba
Alibaba Open Source for everyone
-
D3
Data-Driven Documents codes.
-
Tencent
China tencent open source team.
from vietocr.