Comments (3)
(Update:此问题已在 v1.2.6 解决。)
v1.2.5 的原回复:
您例图的上下边缘太窄,这会阻碍OCR文本检测算法的解析。这是本项目采用的识别库PaddleOCR中 文本检测(det)目前的一个缺陷,它需要一定的额外空间来确定文字范围框。
只要加大图片的高度,就能让识别准确率恢复正常:
👇增加高度之后:由于没有选择俯仰或倾斜方式,飞行方式指示器显示A/P处于驾驶盘操纵(CWS)方式。
因此,这个问题的临时解决方法:
- 截取上下边缘更多的素材图片用于识别。据我测试,只要上下边缘 >= 一个字符的高度,就不会影响识别准确度。
可能的程序优化方式:(我暂时没计划实现这些优化)
- 针对性地训练文本检测det模型用于该场景。
- 在OCR前预处理,为高度过窄的图片自动添加空白边缘。
关于其他家API:
- 我测试了腾讯OCR在线接口,似乎没有这个问题。你有大量需求的话,也许可以寻找使用 腾讯在线api(收费) 的同类项目。
from umi-ocr.
感谢答复
from umi-ocr.
新版本 v1.2.6
已经彻底解决这个问题了。随着识别引擎的更新,窄边图片不会降低准确度
from umi-ocr.
Related Issues (20)
- 没有问题了
- Rapid http接口怎么提高认识率? HOT 3
- umi程序作为api调用过程中出现:PaddleOCR-json.exe-应用程序错误 HOT 2
- 自动截图 HOT 1
- win arm版本点击exe无反应 HOT 10
- 能否像python库一样引入umiOrc的功能 HOT 1
- 关于can't find python3.dll和任务异常弹窗后软件无法操作的问题 HOT 2
- 谢谢这么好用的Umi,强烈请求加入罗马数字等特别字符识别! HOT 1
- 多显示器截图不准确 HOT 1
- 小学教材orc出错 HOT 3
- HTTP过几天后接口无响应,不知道是不是卡死,只能重启! HOT 1
- 建议:在识别结果文本中,增加未识别图片占位符! HOT 6
- UMI-OCR V2.1.2 needs more funciton HOT 2
- 【安卓】可否集成到安卓上,在移动端非常需要!armv7、arm64、x86、x86_64,飞桨官方的只有arm,但考虑到很多机器CPU无法转义执行,建议所有abi都支持一下 HOT 1
- 能否增加一个选项,截图时屏幕是否变暗 HOT 2
- 跪求linux命令行版 HOT 2
- Performance issue over HTTP HOT 6
- 跪求支持韓文OCR功能! HOT 3
- 全新部署的WIN10 LTSC 2021系统上启动报错:Cannot load python3.dll HOT 2
- 最新的2.12版本http调用图片base64 ocr 返回为什么不是正常的json 会有换行符的存在破坏掉json格式 HOT 2
Recommend Projects
-
React
A declarative, efficient, and flexible JavaScript library for building user interfaces.
-
Vue.js
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
-
Typescript
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
-
TensorFlow
An Open Source Machine Learning Framework for Everyone
-
Django
The Web framework for perfectionists with deadlines.
-
Laravel
A PHP framework for web artisans
-
D3
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
-
Recommend Topics
-
javascript
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
-
web
Some thing interesting about web. New door for the world.
-
server
A server is a program made to process requests and deliver data to clients.
-
Machine learning
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
-
Visualization
Some thing interesting about visualization, use data art
-
Game
Some thing interesting about game, make everyone happy.
Recommend Org
-
Facebook
We are working to build community through open source technology. NB: members must have two-factor auth.
-
Microsoft
Open source projects and samples from Microsoft.
-
Google
Google ❤️ Open Source for everyone.
-
Alibaba
Alibaba Open Source for everyone
-
D3
Data-Driven Documents codes.
-
Tencent
China tencent open source team.
from umi-ocr.