Comments (10)
@haneSier 训练集是这样的:
不定长是因为训练的时候只确定了height=32, width=None,所以可以识别任意长度,不过一般有限制。
from chinese-ocr.
from chinese-ocr.
不定长识别和你给定的训练集长度有关,比如说你训练集中图片长度为200,然而你feed到神经网络里的是将200resize成100的图片,那么在你训练好之后,识别其他不同长度的图片时就要按同样比例放缩
from chinese-ocr.
@Sierkinhane 那我的数据集全是一样长度的,是不是就不能识别不同长度的那种数据了
?
from chinese-ocr.
并不是
from chinese-ocr.
只要你的放缩比例合适就ok
from chinese-ocr.
https://github.com/Sierkinhane/crnn_chinese_characters_rec可以看看我的实现,在test.py中
from chinese-ocr.
https://github.com/Sierkinhane/crnn_chinese_characters_rec可以看看我的实现,在test.py中
请问chinese ocr这个的ctpn是使用的ctpn吗,怎么感觉是faster rcnn
from chinese-ocr.
from chinese-ocr.
你好,ctpn是2016年提出的算法,是一种基于目标检测的文字识别网络,在faster的基础上,去掉了roi以及后面的类别和box回归计算,并且在basenet上,faster使用cnn,而ctpn在cnn之后使用rnn和fc来生成预测的anchorbox和类别。这样修改的原因是,ctpn用来处理文本行的提取,使用rnn是为了链接相邻的box,考虑了语义信息,另外,在文本识别任务中,只包含文本和背景两类,因此去掉了faster中的roi层和后续的损失计算。另外,ctpn目前默认只能检测水平文本,修改anchor可以支持垂直文本检查,当前这个repo是我比较早期的项目,很久没有更新过相关文档了,我会在接下来一个月内完成目前文档的更新,并且加入对ctpn,crnn,ctc解码策略的一些解释。 发自我的 iPhone
…
在 2019年2月27日,下午9:27,Chunyu Hao @.***> 写道: https://github.com/Sierkinhane/crnn_chinese_characters_rec可以看看我的实现,在test.py中 请问chinese ocr这个的ctpn是使用的ctpn吗,怎么感觉是faster rcnn — You are receiving this because you were mentioned. Reply to this email directly, view it on GitHub, or mute the thread.
谢谢,会持续关注的
from chinese-ocr.
Related Issues (20)
- 英語ocr train
- 请教下,win10环境跑demo.py一直跑不起来,怎么回事。。 HOT 1
- 编译不过 HOT 1
- 关于CTC的疑问
- 如何获取每个字的坐标? HOT 1
- 请问如何部署环境啊?按照环境部署那儿做一直失败。
- CRNN 训练问题 accuracy:0.0 ,train loss:inf HOT 1
- 我配置了两天多,终于在windows10+anaconda3+python3.6+pytorch下配置好了,不过速度和准确率感人。 HOT 4
- 商务合作
- xiaofengshi,你这狗比,从哪里抄的代码,我搞了几天都没运行起来,日**的B
- 关于crnn部分的demo问题
- 出现File "D:/新建文件夹 (4)/pythonProject5/CHINESE-OCR-master/ctpn/lib/utils/bbox.py", line 14 ctypedef np.float_t DTYPE_t ^ SyntaxError: invalid syntax HOT 4
- python3.8,torch1.7,cudnn=11.0可以跑吗? HOT 1
- 使用作者的pytorch-train/crnn.main.py训练,accuracy一直为0 HOT 2
- 你们识别图片要多久啊,为什么我要四分钟才识别完成
- 计算不出结果,求解是为什么?
- 请问一下作者,这个demo可以正常运行吗,代码文件里面好像没有包括训练好的模型 HOT 2
- 请教一下,pytorch ocr crnn的resnet34 pth文件怎么转onnx? HOT 1
- 文字方向检测模型的链接失效,求分享,谢谢
- 配置了四五天都还没成功,麻了,提示大概是Blas GEMM launch failed
Recommend Projects
-
React
A declarative, efficient, and flexible JavaScript library for building user interfaces.
-
Vue.js
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
-
Typescript
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
-
TensorFlow
An Open Source Machine Learning Framework for Everyone
-
Django
The Web framework for perfectionists with deadlines.
-
Laravel
A PHP framework for web artisans
-
D3
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
-
Recommend Topics
-
javascript
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
-
web
Some thing interesting about web. New door for the world.
-
server
A server is a program made to process requests and deliver data to clients.
-
Machine learning
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
-
Visualization
Some thing interesting about visualization, use data art
-
Game
Some thing interesting about game, make everyone happy.
Recommend Org
-
Facebook
We are working to build community through open source technology. NB: members must have two-factor auth.
-
Microsoft
Open source projects and samples from Microsoft.
-
Google
Google ❤️ Open Source for everyone.
-
Alibaba
Alibaba Open Source for everyone
-
D3
Data-Driven Documents codes.
-
Tencent
China tencent open source team.
from chinese-ocr.