无法获取在线体验版的使用的模型版本，分别尝试了det模型的ch_PP-OCRv4 infer版和server_infer版，以及rec模型的infer版和server_in

我也遇到了同样的情况，体验版地址：<a href="https://aistudio.baidu.com/community/app/91660" rel="nofollo

我也遇到了同样的情况，体验版地址：<a href="https://aistudio.baidu.com/community/app/91660"

在线体验版是AIStudio平台的在线体验吗？是的是的，<a href="htt

PP-OCRv4在线体验版使用离线推理的效果不一致 about paddleocr HOT 8 CLOSED

linssonSUSUSU commented on June 18, 2024

PP-OCRv4在线体验版使用离线推理的效果不一致

from paddleocr.

Comments (8)

UserWangZz commented on June 18, 2024 1

我与原题主的测试图片不相同，但遇到的问题类型是相同的：某一行文字漏检。对于我来说线上版本的检测结果很理想，但离线模型就会出现漏检；补充说明下：我是通过pip install paddleocr安装，检测代码为
from paddleocr import PaddleOCR 
res = PaddleOCR(use_angle_cls=True, lang="ch").ocr(img_arr, cls=True)[0]
print(res )
期间，我查阅了其他issue，使用了多种trick，比如调参：det_db_thresh、det_db_score_mode->slow、det_limit_side_len之类，或者对待测图片做padding等方式；整体检测结果有提升但仍达不到线上的效果。

从您 @UserWangZz 的检测结果上来看离线server模型下也出现了漏检Sesame单词的情况，确实逊色于线上的结果。您一开始说的：线上上传图片后，图片被压缩导致该问题；但是直觉上来说，图片被压缩应该效果会更差 (｀・ω・´)

通过您的实验，我的疑问是： 1、是否由于线上版本参数设置和离线模型的参数设置有异，导致它们的结果不相同 2、线上版本是否对被测图像有其他处理 3、从您的实验看，对图片进行裁切后效果提升显著，可以具体说说是怎样进行裁切处理的吗

Q1: 线上和离线模型参数一致
Q2：线上没有对图片进行其他的预处理
线上和离线模型参数设置，推理模型等均一致
Q3：对图片仅简单裁切，相当于改变了图像的输入大小
下面是实验三的输入图片：

from paddleocr.

TingquanGao commented on June 18, 2024

在线体验版是AIStudio平台的在线体验吗？

from paddleocr.

gudufengzhongyipilang commented on June 18, 2024

我也遇到了同样的情况，体验版地址：https://aistudio.baidu.com/community/app/91660

from paddleocr.

gudufengzhongyipilang commented on June 18, 2024

我也遇到了同样的情况，体验版地址：https://aistudio.baidu.com/community/app/91660

@TingquanGao

from paddleocr.

linssonSUSUSU commented on June 18, 2024

在线体验版是AIStudio平台的在线体验吗？

是的是的，https://aistudio.baidu.com/community/app/91660

from paddleocr.

UserWangZz commented on June 18, 2024

目前定位到的问题可能是线上上传图片后，图片被压缩导致的。
线上使用det_server和rec_server模型
我们使用server模型和mobile模型进行测试结果如下
mobile模型：
[2024/05/23 08:32:38] ppocr DEBUG: Black, 0.986
[2024/05/23 08:32:38] ppocr DEBUG: Desame, 0.881
[2024/05/23 08:32:38] ppocr DEBUG: Mushroom Powder, 0.959
[2024/05/23 08:32:38] ppocr DEBUG: 黑芝麻香菇粉, 0.999
server模型
[2024/05/23 08:38:03] ppocr DEBUG: Black, 0.995
[2024/05/23 08:38:03] ppocr DEBUG: Mushroom Powder, 0.971
[2024/05/23 08:38:03] ppocr DEBUG: 黑芝麻香菇粉, 0.997
[2024/05/23 08:38:03] ppocr DEBUG: ESTLADY, 0.946
对图片进行裁切后，使用server模型推理：
[2024/05/23 08:47:58] ppocr DEBUG: Black, 0.992
[2024/05/23 08:47:58] ppocr DEBUG: S, 0.976
[2024/05/23 08:47:58] ppocr DEBUG: esame, 0.995
[2024/05/23 08:47:58] ppocr DEBUG: Mushroom Powder, 0.964
[2024/05/23 08:47:58] ppocr DEBUG: 黑芝麻香菇粉, 0.996
[2024/05/23 08:47:58] ppocr DEBUG: ESTLADY, 0.985

from paddleocr.

gudufengzhongyipilang commented on June 18, 2024

我与原题主的测试图片不相同，但遇到的问题类型是相同的：某一行文字漏检。对于我来说线上版本的检测结果很理想，但离线模型就会出现漏检；补充说明下：我是通过pip install paddleocr安装，检测代码为

from paddleocr import PaddleOCR 
res = PaddleOCR(use_angle_cls=True, lang="ch").ocr(img_arr, cls=True)[0]
print(res )

期间，我查阅了其他issue，使用了多种trick，比如调参：det_db_thresh、det_db_score_mode->slow、det_limit_side_len之类，或者对待测图片做padding等方式；整体检测结果有提升但仍达不到线上的效果。

从您 @UserWangZz 的检测结果上来看离线server模型下也出现了漏检Sesame单词的情况，确实逊色于线上的结果。您一开始说的：线上上传图片后，图片被压缩导致该问题；但是直觉上来说，图片被压缩应该效果会更差 (｀・ω・´)

通过您的实验，我的疑问是：
1、是否由于线上版本参数设置和离线模型的参数设置有异，导致它们的结果不相同
2、线上版本是否对被测图像有其他处理
3、从您的实验看，对图片进行裁切后效果提升显著，可以具体说说是怎样进行裁切处理的吗

from paddleocr.

gudufengzhongyipilang commented on June 18, 2024

好的明了了~
实在不行我就买智能云上ocr的api用吧ヽ(ー_ー)ノ

from paddleocr.

PP-OCRv4在线体验版使用离线推理的效果不一致 about paddleocr HOT 8 CLOSED

Comments (8)

Related Issues (20)

Recommend Projects

React

Vue.js

Typescript

TensorFlow

Django

Laravel

D3

Recommend Topics

javascript

web

server

Machine learning

Visualization

Game

Recommend Org

Facebook

Microsoft

Google

Alibaba

D3

Tencent