├─captcha_gen # 生成验证码
├─captcha_parse # 解析验证码
├─mapping # 一些字典表
├─models_nc # 南川的模型
│ ├─MNIST # 使用pytorch跑的官方MNIST数据集
│ ├─Lets_OCR # 使用pytorch跑的CRNN模型(端到端)
├─models_zkj # 科神的模型
├─src # 比赛的数据集
├─references # 参考
├─test # 一些通用测试文件
├─general.py # 一些通用函数
MNIST是一个应用广泛的手写数字数据集。请参考http://yann.lecun.com/exdb/mnist/ 了解不同算法识别MNIST库的结果比较。
CAPTCHA是一个自动生成验证码的Python库。
Tesseract-OCR是一个OCR识别的Python库。
Pillow是一个图像处理的Python库。
OpenCV是一个计算机视觉库,cv2是对应的Python包。
深度学习也经常被用在图像识别中,常见的库有Tensorflow,PyTorch, keras等。
Augmentor库是机器学习中训练图像识别的利器。在你有少数样本的情况下,可以通过对原始验证码的变换,来拓展你的训练数据集
- Python-Pillow-OTSU算法_Python_valueerror404_gumoo的博客-CSDN博客
- 阈值化分割(二)OTSU法-附Python实现_Python_sylvester的博客-CSDN博客
- ypwhs/captcha_break: 验证码识别
- dee1024/pytorch-captcha-recognition: 基于CNN训练的一套 "端到端" 的验证码识别模型,使用深度学习+训练数据+大量计算力,纯数字识别率高达 99.99%,数字+字母识别率 96%
- 996refuse/zheye: 者也 - 知乎 倒立的文字 汉字验证码识别程序
- 1zlab/1ZLAB_OpenCV_Handwriting: OpenCV手写字体识别专题教程主要侧重的是对手写数字样本的采集与预处理部分, 主要包括图像透视变换,二值化,联通阈检索,字符分割。
references/验证码识别技术分析.pdf