Giter VIP home page Giter VIP logo

rapidocronnx's Introduction

RapidOcrOnnx

联系方式

  • QQ1群:887298230 已满,
  • QQ2群:755960114 已满,
  • QQ3群:450338158
  • QQ4群:419196348

Project下载

  • 整合好源码和依赖库的完整工程项目,可以在Release中下载(github)
  • 可到Q群共享内下载,以Project开头的压缩包文件为源码工程,例:Project_RapidOcrOnnx-版本号.7z
  • 如果想自己折腾,则请继续阅读本说明

Demo下载(win、mac、linux)

  • 编译好的demo,可以在release中下载,或者Q群共享内下载
  • 各平台可执行文件:linux-bin.7z、macos-bin.7z、windows-bin.7z
  • 用于java的jni库:linux-jni.7z、macos-jni.7z、windows-jni.7z
  • 用于C的动态库:linux-clib.7z、macos-clib.7z、windows-clib.7z
  • C动态库调用范例:RapidOcrOnnxLibTest
  • 注意:linux编译平台为ubuntu18.04,如果你的linux版本无法运行demo,请自行从源码编译依赖库和完整项目。

介绍

请查看项目主仓库:https://github.com/RapidAI/RapidOCR

这个项目使用onnxruntime框架进行推理

采用onnxruntime框架https://github.com/microsoft/onnxruntime

更新说明

2022-10-15 update v1.1.1

  • opencv 4.6.0
  • onnxruntime 1.12.1
  • windows支持mt版引用库
  • rec模型输入图片高度改为48

2022-10-16 update v1.1.2

  • 修复:字典添加空格

2022-10-17 update v1.1.3

  • 修复:scoreToTextLine方法索引越界问题
  • Windows控制台编码修改为UTF8

2022-10-20 update v1.2.0

  • 再次修复空格问题
  • 增加GPU(cuda)支持,需要自行下载整合依赖库
  • windows下的free()方法更焕为_aligned_free()
  • 修改默认输入参数
  • 修改benchmark输出样式

2022-10-28 update v1.2.1

  • 适配onnxruntime 1.13.1
  • 修了些warning

2023-02-13 update v1.2.2

  • 适配onnxruntime 1.14.0

2024-01-07 update v1.2.3

  • onnxruntime 1.15.1
  • opencv 4.8.1

模型下载

整合好的范例工程自带了模型,在models文件夹中

RapidOcrOnnx/models
    ├── ch_PP-OCRv3_det_infer.onnx
    ├── ch_PP-OCRv3_rec_infer.onnx
    ├── ch_ppocr_mobile_v2.0_cls_infer.onnx
    └── ppocr_keys_v1.txt

编译说明

GPU版附加说明

测试说明

  1. 根据系统下载对应的程序包linux-bin.7z、macos-bin.7z、windows-bin.7z,并解压.
  2. 把上面的模型下载,解压到第一步解压的文件夹里.
  3. 终端运行run-test.sh或命令行运行run-test.bat,查看识别结果.
  4. 终端运行run-benchmark.sh或命令行运行run-benchmark.bat,查看识别过程平均耗时.

FAQ

windows10下bat执行错误

  • 在win、linux、mac系统下,文本文件使用不同的换行符格式,win是CRLF,linux是LF,mac是CR
  • github的"Download ZIP"按钮下载的整个仓库代码,默认格式是UNIX换行符,此时bat脚本在windows平台执行会出错
  • 解决方法1:从Release中下载完整工程压缩包
  • 解决方法2:使用git clone命令同步仓库代码,git可以自动转换文件格式
  • 解决方法3:使用UltraEdit等文本编辑器,把bat文件的换行符转成win格式

windows静态链接msvc

  • 作用:静态链接CRT(mt)可以让编译出来的包,部署时不需要安装c++运行时,但会增大包体积;
  • 需要mt版的引用库,参考编译说明,下载mt版的库;

windows提示缺少"VCRUNTIME140_1.dll"

下载安装适用于 Visual Studio 2015、2017 和 2019 的 Microsoft Visual C++ 可再发行软件包 下载地址

Windows7执行错误|中文乱码

  1. cmd窗口左上角-属性
  2. 字体选项卡-选择除了“点阵字体”以外的TrueType字体,例如:Lucida Console、宋体
  3. 重新执行bat

Windows调试运行

  • 下载范例项目工程自带的引用库是Release版,不能用于调试运行
  • debug版的引用库未压缩时容量超过1GB,极限压缩后也超过了100MB,请自行编译或到群共享里寻找
  • debug版的引用库必须是md版
  • 把debug版的引用库替换到范例工程的对应文件夹
  • 双击generate-vs-project.bat,选择2)Debug,生成对应的build-win-vsxxx-xx文件夹
  • 进入生成的文件夹,打开RapidOcrOnnx.sln
  • 右边解决方案管理器,选中RapidOcrOnnx,右键->设为启动项目,并生成(查看输出log,确保生成成功)
  • 如果引用库是dll,需要把对应的dll文件,例onnxruntime.dll复制到build-win-vsxxx-xx文件夹\Debug,跟上一步生成的RapidOcrOnnx.exe放在一起
  • 右边解决方案管理器,选中RapidOcrOnnx,右键->属性->调试-> 命令参数->--models ../models --det ch_PP-OCRv3_det_infer.onnx --cls ch_ppocr_mobile_v2.0_cls_infer.onnx --rec ch_PP-OCRv3_rec_infer.onnx --keys ppocr_keys_v1.txt --image ../images/1.jpg
  • 工具栏,点击绿色三角号启动"本地Windows调试器"
  • 第一次运行的话,查看左下角,等待加载各dll符号,网络不好的话,要等挺久的

输入参数说明

  • 请参考main.h中的命令行参数说明。
  • 每个参数有一个短参数名和一个长参数名,用短的或长的均可。
  1. -d或--models:模型所在文件夹路径,可以相对路径也可以绝对路径。
  2. -1或--det:det模型文件名(含扩展名)
  3. -2或--cls:cls模型文件名(含扩展名)
  4. -3或--rec:rec模型文件名(含扩展名)
  5. -4或--keys:keys.txt文件名(含扩展名)
  6. -i或--image:目标图片路径,可以相对路径也可以绝对路径。
  7. -t或--numThread:线程数量。
  8. -p或--padding:图像预处理,在图片外周添加白边,用于提升识别率,文字框没有正确框住所有文字时,增加此值。
  9. -s或--maxSideLen :按图片最长边的长度,此值为0代表不缩放,例:1024,如果图片长边大于1024则把图像整体缩小到1024再进行图像分割计算,如果图片长边小于1024则不缩放,如果图片长边小于32,则缩放到32。
  10. -b或--boxScoreThresh:文字框置信度门限,文字框没有正确框住所有文字时,减小此值。
  11. -o或--boxThresh:请自行试验。
  12. -u或--unClipRatio:单个文字框大小倍率,越大时单个文字框越大。此项与图片的大小相关,越大的图片此值应该越大。
  13. -a或--doAngle:启用(1)/禁用(0) 文字方向检测,只有图片倒置的情况下(旋转90~270度的图片),才需要启用文字方向检测。
  14. -A或--mostAngle:启用(1)/禁用(0) 角度投票(整张图片以最大可能文字方向来识别),当禁用文字方向检测时,此项也不起作用。
  15. -h或--help:打印命令行帮助。

关于内存泄漏与valgrind

  • 项目根目录的valgrind-memcheck.sh用来检查内存泄漏(需要debug编译)。
  • 常见的并行库有tbb,hpx,openmp,gcd,concurrency,pthread
  • 并行库的种类可以看:https://docs.opencv.org/4.x/db/d05/tutorial_config_reference.html
  • 测试了openmp和pthread,目前已知这类并行库会导致检查报告中出现"possibly lost"
  • opencv只做简单的图像预处理,可以完全不使用任何并行库,但需要定制编译
  • onnxruntime1.6.0或之前,默认引用openmp,从1.7.0开始默认关闭openmp并使用自带的ThreadPool代码
  • 阅读报告可以看出"possibly lost"发生位置均在引用的第三方库(如果使用了并行库的话),如opencv或onnxruntime
  • "possibly lost"不一定是内存泄露
  • 如果opencv想定制编译不使用任何并行库,可以使用以下参数进行编译
-DWITH_TBB=OFF
-DWITH_HPX=OFF
-DWITH_OPENMP=OFF
-DWITH_GCD=OFF
-DWITH_CONCURRENCY=OFF
-DWITH_PTHREADS_PF=OFF

rapidocronnx's People

Contributors

benjaminwan avatar swhl avatar

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar  avatar  avatar  avatar  avatar  avatar

rapidocronnx's Issues

大量识别图片后,内存不断增长,直至OOM

环境: ubuntu1~20.04.2
硬件配置:4c 8g
onnxruntime: 1.16.1
OpenCV: 4.8.0
RapidOcr-Java: 0.0.4

客户端使用RapidOcr-Java,大量识别不同图片后,看到java 堆外内存在不断增加(过程中没有发现内存回收的情况),直至OOM,请问是什么原因?

编译错误: error adding symbols: DSO missing from command line

您好,我按照编译说明 对代码进行编译,但出现以下报错,想咨询一下是什么问题?

========请先参考README.md准备好编译环境========

========编译选项========
请输入编译选项并回车: 1)Release, 2)Debug
1
请选择编译输出类型并回车: 1)BIN可执行文件,2)JNI动态库,3)C动态库
请注意:如果选择2)JNI动态库时,必须安装配置Oracle JDK
1
onnxruntime: 1)CPU(默认), 2)GPU(cuda)
注意:范例工程默认集成CPU版,CUDA版仅支持Linux64且需下载
1
~/ocr/RapidOcrOnnx/Linux-CPU-BIN ~/ocr/RapidOcrOnnx
cmake -DCMAKE_INSTALL_PREFIX=install -DCMAKE_BUILD_TYPE=Release -DOCR_OUTPUT=BIN -DOCR_ONNX=CPU ..
配置Linux OnnxRuntime 路径: /home/admin/ocr/RapidOcrOnnx/onnxruntime-static/linux
-- OnnxRuntime_LIBS: onnxruntime_session;onnxruntime_optimizer;onnxruntime_providers;onnxruntime_util;onnxruntime_framework;onnxruntime_graph;onnxruntime_common;onnxruntime_mlas;onnxruntime_flatbuffers;onnx;onnx_proto;protobuf-lite;re2;flatbuffers;nsync_cpp
-- OnnxRuntime_INCLUDE_DIRS: /home/admin/ocr/RapidOcrOnnx/onnxruntime-static/linux/include
配置Linux OpenCV 路径: /home/admin/ocr/RapidOcrOnnx/opencv-static/linux/lib/cmake/opencv4
-- OpenCV_LIBS: opencv_calib3d;opencv_core;opencv_dnn;opencv_features2d;opencv_flann;opencv_highgui;opencv_imgcodecs;opencv_imgproc;opencv_ml;opencv_objdetect;opencv_photo;opencv_shape;opencv_stitching;opencv_superres;opencv_video;opencv_videoio;opencv_videostab
-- OpenCV_INCLUDE_DIRS: /usr/local/include;/usr/local/include/opencv
-- Configuring done
-- Generating done
-- Build files have been written to: /home/admin/ocr/RapidOcrOnnx/Linux-CPU-BIN
Consolidate compiler generated dependencies of target benchmark
Consolidate compiler generated dependencies of target RapidOcrOnnx
[  4%] Linking CXX executable RapidOcrOnnx
[  9%] Linking CXX executable benchmark
/usr/bin/ld: /home/admin/ocr/RapidOcrOnnx/onnxruntime-static/linux/lib/libonnxruntime_common.a(env.cc.o): undefined reference to symbol 'dlclose@@GLIBC_2.2.5'
/usr/lib64/libdl.so.2: error adding symbols: DSO missing from command line
collect2: error: ld returned 1 exit status
gmake[2]: *** [RapidOcrOnnx] Error 1
gmake[1]: *** [CMakeFiles/RapidOcrOnnx.dir/all] Error 2
gmake[1]: *** Waiting for unfinished jobs....
/usr/bin/ld: /home/admin/ocr/RapidOcrOnnx/onnxruntime-static/linux/lib/libonnxruntime_common.a(env.cc.o): undefined reference to symbol 'dlclose@@GLIBC_2.2.5'
/usr/lib64/libdl.so.2: error adding symbols: DSO missing from command line
collect2: error: ld returned 1 exit status
gmake[2]: *** [benchmark] Error 1
gmake[1]: *** [CMakeFiles/benchmark.dir/all] Error 2
gmake: *** [all] Error 2
[  4%] Linking CXX executable RapidOcrOnnx
/usr/bin/ld: /home/admin/ocr/RapidOcrOnnx/onnxruntime-static/linux/lib/libonnxruntime_common.a(env.cc.o): undefined reference to symbol 'dlclose@@GLIBC_2.2.5'
/usr/lib64/libdl.so.2: error adding symbols: DSO missing from command line
collect2: error: ld returned 1 exit status
gmake[2]: *** [RapidOcrOnnx] Error 1
gmake[1]: *** [CMakeFiles/RapidOcrOnnx.dir/all] Error 2
gmake: *** [all] Error 2
~/ocr/RapidOcrOnnx

如何输出坐标

我不是程序员,用 AutoHotkey 脚本加载 RapidOcrOnnx.dll 来识别图片。
请问如何设置才能输出坐标,或者说 json 呢?
RapidOcrOnnx.dll 只有5个函数,好像没有一个是用于配置这些参数的。
OcrDetect() 最后输入的结构也没有配置输出结果的项。

还有,如何设置才能识别空格呢?比如中英混合时,英文前后都有空格,怎么识别出这些空格呢?

onnx模型识别率与原始paddle模型识别率差异

按照说明一步步成功实现了中文识别功能,但在测试到一张测试图片时候发现转换后的onnx模型识别的结果与原paddle模型的推理识别结果有差异。
原paddle模型识别到图片中有2个区域,且其中一个值非常准确,而使用转换后的onnx模型只识别到1个区域,且结果不正确。
不知道是不是paddle在推理时对图片做了简单的预处理导致的识别率差异?

DBnet得分是否可以支持Slow模式

paddleocr 中给到了det_db_score_mode的配置项,支持fast和slow,fast是根据polygon的外接矩形边框内的所有像素计算平均得分,slow是根据原始polygon内的所有像素计算平均得分,计算速度相对较慢一些,但是更加准确一些。

该参数是否可以在rapidocronnx中提供呢
Screenshot 2024-01-05 at 15 28 05
Screenshot 2024-01-05 at 15 28 35

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.