Comments (5)
问题1. 500张图片的数据集对于识别任务来说有点少。
问题2. 使用预训练模型对拼音数据进行finetune是可以的,针对问题提到的情况,建议考虑增加数据量,即将发布的PPChatOCR v3将带来全新的融合数据训练机制,可以一定程度上保证模型在通用数据集上的精度,同时在垂类数据集上保证可行的精度。
问题3. 根据所提供的信息,感觉可能是识别的字典没有匹配上的感觉。
问题4. 样例图片中,可能作文的格子影响了检测模型的检测,导致识别效果不佳,也有可能检测结果可以,但是因为格子的竖线影响了识别模型的精度,导致最后被过滤掉。
from paddleocr.
@UserWangZz 了解了,数据集的数量有待增加。然后PPChatOCR v3发布了,我试试看。
字典用的ppocr_keys_v1.txt,然后加了几个里头没有的带声调的字母。所以是因为这个导致index变化了,所以模型预测不符合预期? 那是不是说如果要额外增加字典的字符,只能从末尾append去加喽?
是的,因为模型是基于这个字典进行的训练,如果index变化了,就会导致错误
from paddleocr.
@UserWangZz 我用v3和未修改的ppocr_keys_v1.txt测试上面beizhu.png,能够正常识别了!
但是只要在ppocr_keys_v1.txt加上自定义的字符,识别结果就非常奇怪。这是正常的么嘛?(已经是append到末尾了)
![]()
这种情况是字典增多与模型最后的FC层维度不匹配造成的,可以简单微调模型,有能力可以冻住模型参数,只更新FC层尝试
from paddleocr.
@UserWangZz 了解了,数据集的数量有待增加。然后PPChatOCR v3发布了,我试试看。
字典用的ppocr_keys_v1.txt,然后加了几个里头没有的带声调的字母。所以是因为这个导致index变化了,所以模型预测不符合预期?
那是不是说如果要额外增加字典的字符,只能从末尾append去加喽?
from paddleocr.
@UserWangZz 我用v3和未修改的ppocr_keys_v1.txt测试上面beizhu.png,能够正常识别了!
但是只要在ppocr_keys_v1.txt加上自定义的字符,识别结果就非常奇怪。这是正常的么嘛?(已经是append到末尾了)
from paddleocr.
Related Issues (20)
- 中文版面分析CDLA,自己训练出来的验证集bbox ap比官方的picodet_lcnet_x1_0_fgd_layout_cdla低好几个点
- PaddleOCR returning only the first page when performing ocr on a PDF HOT 1
- 短数字无法检测问题 HOT 1
- kie_ser训练问题
- 使用PP-OCRv3做文字检测微调,在T4上跑训练无法训练,报错返回-9 HOT 4
- Paddle OCR 推理模型转ONNX,固定shape后,ONNX结果相差很大,不固定shape,结果与paddle推理模型保持一致,这个问题要怎么处理哇: HOT 1
- indonesian 是哪个字典?没有找到id 的 HOT 2
- PPStructure版面分析时对原图返回的是figure,对原图灰度化后却返回table是为什么,请问怎么指定他返回figure? HOT 1
- 有一个中文字识别不出来 HOT 7
- OSError: (External) CUDA error(209), no kernel image is available for execution on the device. HOT 3
- 测试russia识别别字典报错 HOT 3
- pyinstaller打包后不能运行,不打包只跑py程序正常,报错是RuntimeError: MKL_Free_Buffers not found. HOT 3
- 引用PaddleOCR模块后会导致logging的默认logger中添加一项haddler HOT 5
- kie表格ser训练报错 HOT 2
- paddleocr运行报错 SIGSEGV HOT 2
- re模型预测报错
- rec v4模型训练,acc不提升,从第5个epoch开始一直到第500个始终维持在0.2
- paddleocr 2.7.3 GPU和CPU推理结果不一致 HOT 7
- PP-Structure 关键信息抽取--开始训练,使用增值税发票的数据集进行训练,gpu和cpu都报错 HOT 2
Recommend Projects
-
React
A declarative, efficient, and flexible JavaScript library for building user interfaces.
-
Vue.js
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
-
Typescript
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
-
TensorFlow
An Open Source Machine Learning Framework for Everyone
-
Django
The Web framework for perfectionists with deadlines.
-
Laravel
A PHP framework for web artisans
-
D3
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
-
Recommend Topics
-
javascript
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
-
web
Some thing interesting about web. New door for the world.
-
server
A server is a program made to process requests and deliver data to clients.
-
Machine learning
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
-
Visualization
Some thing interesting about visualization, use data art
-
Game
Some thing interesting about game, make everyone happy.
Recommend Org
-
Facebook
We are working to build community through open source technology. NB: members must have two-factor auth.
-
Microsoft
Open source projects and samples from Microsoft.
-
Google
Google ❤️ Open Source for everyone.
-
Alibaba
Alibaba Open Source for everyone
-
D3
Data-Driven Documents codes.
-
Tencent
China tencent open source team.
from paddleocr.