Giter VIP home page Giter VIP logo

pandaocr's Introduction

PandaOCR - 多功能OCR图文识别+翻译+朗读+弹窗+公式+表格+图床+搜图+二维码

<VER:2.72>

2022-03-16 更新

专业版本:

  • 🥇目前全新重构的PandaOCR.Pro专业版已发布,它更快速稳定、接口更丰富、操作更简单,推荐您使用! 查看PandaOCR.Pro专业版
  • 针对当前普通版的说明:
  • 会继续维护普通版,保留所有接口但不再增加新功能,专业版的版本号之所以从5.x开始,正是考虑到普通版以后还会有更新所以保留了一段版本号。
  • 您可以继续像以往那样免费使用普通版,不用担心推出专业版后导致普通版停用,如果有更高需求可以尝试专业版。
  • 对于捐助的朋友我表示非常感谢,没有你们的支持PandaOCR坚持不了现在,感谢!

特别声明:

  • 本工具一直只在Github发布和更新,目前并没有所谓PandaOCR官网或熊猫OCR官网,从其他网站下载的PandaOCR请自行验证安全性!
  • 目前发现这个免费软件居然被有些可能生活困难的朋友拿到某宝上出售,导致买去用的人反而跑来找我当售后(这不厚道),这太难了,建议买的人找店主解决!

功能介绍:

  • 支持识别引擎:搜狗OCR/API+腾讯OCR/API+百度OCR/API+有道OCR/API+阿里OCR/API+京东OCR+华为OCR+网易OCR+讯飞OCR+金山OCR+灵云OCR+飞桨OCR+合合OCR+网校OCR+易道OCR+薪火OCR+必应OCR+SpaceOCR+YandexOCR

  • 支持公式识别:微软公式+百度公式API+腾讯公式API+Mathpix公式API+网校公式+阿里公式

  • 支持表格识别:有道表格+百度表格API+腾讯表格API+阿里表格/API

  • 支持翻译引擎:搜狗翻译/API+腾讯翻译/API+百度翻译/API+有道翻译/API+谷歌翻译+词霸翻译+必应翻译+沪江翻译+奇虎翻译+海词翻译+小牛翻译+彩云翻译+福昕翻译+欧米翻译+微软翻译+阿里翻译+云译翻译+欧路翻译+灵云翻译+Deepl翻译API+PaPaGo翻译

  • 支持朗读引擎:搜狗朗读x4+腾讯朗读x5+百度朗读x6+京东朗读x2+有道朗读x2+知声朗读x7+讯飞朗读+谷歌朗读+必应朗读

  • 支持快捷键和屏幕边角触发截图识别功能,方便快速

  • 支持截取识别固定区域,适合日语类游戏机翻或生肉字幕机翻

  • 支持右侧小弹窗预览文本信息,快速查看识别/翻译内容

  • 支持智能合并修正文本,让排版更合理,并提高翻译质量

  • 支持设置最多十条固定截图规则,每条规则都能有自己的快捷键

  • 支持监听图像和文本复制操作,快速识别图像文本或翻译复制文本

  • 支持简单的窗口汉化功能,帮助翻译纯英文类软件界面文字

  • 还有一些奇怪的没有列在程序界面上的功能,可以编辑程序目录下的CONFIG.INI配置文件试试


使用技巧:

  • 将鼠标移到各功能组件或按钮上会显示简单的悬停提示帮助你理解程序操作。

  • 配置文件内已添加各功能注释说明,如果想要实现某种功能但在程序界面上没找到相关设置,可以先翻一翻配置文件或许它已经在那里等着你(程序目录下CONFIG.ini即是配置文件)。

  • 如果你有两块屏幕,请勾选“高级截图方式”以解决无法截取第二块屏的问题。

  • 如果你是高分屏或修改了系统DPI缩放,可能出现截图不全或弹窗位置偏移的问题,此时你需要在此程序文件的属性中取消系统DPI设置。

  • 程序界面上存在的设置多数是可以实时生效的不需要频繁点击保存按钮,比如设置语言、更换引擎此类。

  • 有时手工更改了配置文件又不想重启软件可以试试右键点击界面左上角图标重载配置,不要点左键。

  • 从演示版引擎临时更改为API版引擎可以右键点击引擎选择组合框。

  • 鼠标党如果觉得按快捷键识别麻烦可以把鼠标移到屏幕左上角来触发识别,默认配置已启用,也可以编辑配置文件关闭或改为其他位置(配置项:边角触发截图)。

  • 在截图时按住CTRL键可以临时取消识别,只截图并复制至剪贴板。

  • 在截图时按住ALT键可以临时取消修正文本,当识别图像的文本中不包含任何标点符号时建议这样使用。

  • 在文本区输入文本后按CTRL+回车键会直接翻译,不需要再用鼠标点翻译按钮。

  • 在文本区输入文本后按ALT+回车键会直接朗读。

  • 将图片直接拖入至程序界面上会自动开始识别。

  • 在识别或是朗读进行中如果想中止任务可以双击界面右上方“线程”字样处,或按住空格键的同时点击托盘图标。

  • 如果觉得文本区域过小,可以双击文本区使用大窗口浏览或简单编辑。

  • 有些不太用的上的功能建议关闭以减少识别等待时间,比如朗读文本。

  • 在启用了监听复制功能时临时不想执行识别或翻译可以在复制的同时按住空格键。


使用教程:


API版接口申请(默认使用免费的演示版 | 演示版和API版区别):

搜狗:
腾讯:
百度:
有道:
阿里:
讯飞:
网校(学而思/好未来):
Deepl:
Mathpix:
SpaceOCR:

隐私安全:

程序:
  • 程序本身不包含任何恶意代码,如有杀软误报请自行加入白名单(曾提交火绒人工检测为安全)
  • 程序调用了一个51.la的统计,单纯用来统计使用人数,除此之外不会上传您的任何隐私数据
  • 因功能需要,请使用管理员权限运行,程序会调用键鼠钩子,如“划词复制功能”需要鼠标钩子,为避免某些游戏屏蔽热键导致无法截图而使用了键盘钩子
  • 程序的开发与发布均在ESET NOD32杀软保护的环境中完成,如果使用过程中,您系统中某种“安全”软件称「发现木马」,那么此种情形将考验您的判断力
引擎:
  • 本程序不带离线引擎,所调用的识别/翻译/朗读等全部为在线引擎
  • 理论上用户上传到各个引擎的数据都只是缓存数据,通常会在一定时间内清除
  • 但服务器毕竟为各引擎所在公司控制和所有,我无法保证上传数据的绝对安全
  • 所以如果您要处理的数据属于商业或机密数据,请换用其他自己可控的本地私有化产品
  • 如因此发生的任何损失,本人表示概不负责

特别说明:

  • 已知在高分辨率/高分屏下截图功能异常 [尝试解决方法]
  • 如需使用自己申请的ID和KEY,用文本编辑器打开程序目录下的CONFIG.ini文件,在[数据配置]项,将各版本后面数值设为1(0为演示版),并修改下面相应的ID和KEY
  • 如需反馈API版引擎存在的问题,请主动提供相应的ID和KEY给我测试

程序下载:


问题反馈:


程序截图:

默认界面

暗色界面

pandaocr's People

Contributors

miaomiaosoft avatar

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

pandaocr's Issues

使用自己申请的OCR接口

善良的小哥哥或小姐姐,你好,软件的config文件里面有百度OCRID=、百度OCRSECRET=、腾讯OCRID=、腾讯OCRKEY=,但没有搜狗OCR的示例。所以搜狗OCR的话是不是自己添加为搜狗OCRID= 搜狗OCRKEY=就行了呀,谢谢你哦。

大佬.搜狗OCR貌似失效了?

大佬.搜狗OCR貌似失效了?
还有一个问题是能不能截图识别的时候
让整个窗口稍微灰一点的息屏功能
不然不好判断是不是已经触发了
而且红色的虚线太细了很难看清

我不知道你这个右下角提醒是什么功能
我这右下角弹窗什么提示好像没有
希望可以添加头下角已经复制到剪切板的提示(而且可以选择存在的时间)
然后点击右下角提示可以直接跳转到orc界面
还有不能添加背景图片功能吗?
整体白色还是不如黑灰的...

一些建议功能

  1. 其实我不太懂得怎样使用 (4.支持截取识别固定区域,例如可帮助翻译英文游戏/软件中的单词或队友聊天记录), 不知道能不能第1次截图后, 之后勾选启用固定截图, 下次按F4自动截取同区域? 现在启用固定截图确实是会截一个屏幕中间的固定位置, 不知道怎样更改位置

  2. 软件窗口不能改变形状, 配合其他窗口化游戏不太方便

  3. 弹窗能不能加选项将右则改为下方, 左右并排翻译前后文本?

不知名的bug

电脑不用一段时间后,打开出现一堆匹配失败的弹窗

【有一个bug有啊】

snipaste20181120_235925
【启用弹窗提示】勾子不点的情况下截图直接电脑卡住...
只能重启解决...
你测试的时候确保没有重要文件正在作业...

启动初始化特别慢

有时候启动panda ocr时都要大概很长时间才会提示初始化完成,在此期间软件基本失去响应。当然有的时候又比较快,大概3-5秒可以完成。不知道这期间在做什么,从时间波动性上感觉是发送了网络请求(没抓包,猜的),是否可以把不太重要的网络请求变成异步的(比如统计当前使用人数),这样可以快速启动。

“是否修正文本”中的选项分别是什么意思?

image
请问一下,这里面的:
是否修正文本
强行合并
智能合并
游戏通用
彩虹六号
未世鼠疫

第一个比较容易明白,第二个到第五个不太清楚是什么规则,网上查了很多都没有介绍,请问是否能简单介绍一下,谢谢。

使用“固定截图热键”识别小图片(或者图片的区域较小)有问题

如题,勾选“启动固定截图"时使用面板上的快捷键截取到的图能识别,
去掉勾选用配置文件中设置好的”固定截图热键“截取到的同一张图识别不了。

实验了一下,当图片足够大的时候固定截图热键也会生效。
其他方式识别的图片区域大小则没有限制,只有固定截图热键识别的图片要有足够的大小。
能否解决一下这个问题

ps:换其他OCR也是如此

你好,能否新增一个伪原创的功能

简单说就是输入一段文字,系统进行伪原创,输出含义相同但是表述不同的文字,此功能在自媒体,论文查重具有很大的商业运营潜质,需求量很大

【腾讯翻译】有空行bug....

1丶
【腾讯翻译】有空行bug....
会导致无法逐行模式匹配到空白行显示出错...
谷歌引擎貌似也有第2行之后有多出2个空格缩进bug...

【Snipaste】【2019-07-20】No 022812
【Snipaste】【2019-07-20】No 025303

2丶
【逐行模式】能否弹窗显示的时候增加翻译后增加一个空行...
逐行是因为方便看顺便学习一下惹...
如果文字很长的话都窝在很头疼....

【Snipaste】【2019-07-20】No 024422

除了搜狗ocr其他的ocr都识别不了日文

rt,软件设置里设置成“jp”也没卵用,日文全给我当成中文识别了。我去看了下这几个ocr都支持日文啊。搜狗ocr识别不了几次就超上限了。

编辑,是除了有道ocr别的都识别不了日文,口胡了

匹配失败, 请检查正则语句是否有误, 数量: 0

image

这个提示最近弹出比较多, 不知为何?

配置文件如下所示

[程序配置]
开机运行=0
初次启动=1
收展状态=1
识别引擎=1
#指定图像识别语言:auto | zh | en | ja | 此配置限API版,auto只有道支持,其他不支持的将自动转为zh
识别语言=auto
翻译引擎=1
自动翻译=0
翻译来源语言=auto
翻译目标语言=zh
自动朗读=2
朗读引擎=2
#语音朗读播放方式 | 0=先下载再播放,慢 | 1=边下载边播放,快,但不是全都支持 | 默认0
朗读方式=0
朗读音量=70
排除朗读=1
自动复制=0
#复制成功提示 | 0=不启用 | 1=提示音 | 2=托盘气泡
复制提示=1
自动弹窗=0
弹窗内容=2
弹窗宽度=300
弹窗高度=200
#五种不同的半透明弹窗背景:1-5更换 | 0=不启用
弹窗背景=0
弹窗字体=微软雅黑
#十进制颜色数值如:1973790,0为透明
弹窗字体边框=1973790
#渲染方式,系统=0/符号位图+HT=1/符号位图=2/抗锯齿+HT=3/抗锯齿=4/CT+HT=5
弹窗字体渲染=4
#弹窗字体风格:0=普通 | 1=倾斜 | 2=加粗 | 3=加粗倾斜 | 4=删除线 | 5=下划线
弹窗字体风格=2
#十进制颜色数值如:1973790,0为默认黄色
弹窗字体颜色=0
弹窗字体大小=13
主窗字体大小=10
#秒数,0为不启用
自动隐藏弹窗=0
打开网址=0
文本修正=3
符号替换=0
#为文本每行开头添加空格 | 0=不启用 | 1=启用 | 2=只在选择了智能合并时才启用
行首空格=1
#截图像素:0=全屏 | 1=全屏高度-1
截图像素=0
高级截图=0
固定截图=0
#启用后双击选择固定截图规则将同时启用相应的文本修正
固定截图联动=0
截图热键=
#十进制颜色数值如:1973790,0为默认红色
截图选框颜色=327935
截图时透明度=255
#十进制颜色数值如:15000804,主窗口背景色,0为银白色
窗口背景颜色=0
#主窗口透明度,值越小越透明,1-255
窗口透明=245
监听复制=0
#共五种不同的识别加载动画效果 | 1-5开启并选择效果 | 0=禁用
加载动画=1
#定时重载统计数据和某些演示版引擎的COOKIES效验的分钟数 | 0=禁用 | 默认30分钟
定时重载数据=30
恢复焦点窗口=0
#鼠标停留在屏幕角落时触发截图 | 1-4分别为左上角、右上角、左下角、右下角 0=不启用
边角触发截图=0
#0=不启用保存 | 设置图片保存目录即启用,例:Z:\PIC
自动保存截图=0
#0=不启用保存 | 设置识别翻译文本保存目录即启用,例:Z:\PIC
自动保存文本=0
截图放大镜=0
[数据配置]
#0=免费演示版,1=API版(有免费试用也有付费的)
搜狗OCR版本=0
百度OCR版本=0
腾讯OCR版本=0
有道OCR版本=0

搜狗翻译版本=0
腾讯翻译版本=0
百度翻译版本=0
有道翻译版本=0
#请使用自己注册的ID和KEY,以下示例并不可用!
搜狗OCRPID=d16f9bfc81305e1a2dc8b2b3XXXX
搜狗OCRKEY=93611ea9bed496c7bba3dfeaXXXX
百度OCRID=pHYUg3eDVomNgidA6M5T9XXX
百度OCRSECRET=a161vVuzmw3s0iRvrY7CwT28ACZImXXX
腾讯OCRID=1106934XXX
腾讯OCRKEY=7Fs3hF4bsRWU3XXX
有道OCRKEY=1b71a281739afXXX
有道OCRSECRET=8pBxuHZ92zMXmvSpwx75ETyNoVQElXXX

搜狗翻译PID=859d1b4b9875b6805eb51ebb0cda0XXX
搜狗翻译KEY=6d27652a3fe12e3b889481ba6035eXXX
腾讯翻译ID=AKIDxy4DSckKo8HF4i6I6lJk6MRKKD0bCXXX
腾讯翻译KEY=2tY2NadpskRxOeiaHn7FD9tW2NZcXXXX
百度翻译ID=20190310000XXXX
百度翻译KEY=7HOeYQHoZesNaXXXXX
有道翻译KEY=1b71a281739afXXX
有道翻译SECRET=8pBxuHZ92zMXmvSpwx75ETyNoVQElXXX
[固定截图]
#固定截图快捷键:0=不启用 | alt/ctrl/shift+!/1 | !为主键区数字键 | 1为小键盘区数字键 | 示例:alt+! 或 alt+1
固定截图热键=0
固定截图区域=彩虹二号|500|500|300|200
01=彩虹一号|500|500|300|200
02=彩虹二号|500|500|300|200
03=彩虹三号|500|500|300|200
04=彩虹四号|500|500|300|200
05=彩虹五号|500|500|300|200
06=彩虹六号|500|500|300|200
07=彩虹七号|500|500|300|200
08=彩虹八号|500|500|300|200
09=彩虹九号|500|500|300|200
10=彩虹十号|500|500|300|200

有一个问题

用图片识别是时候,一直提醒我图片识别错误,能问下怎么解决么?

那个弹窗能否增加回以前老版本的复制选项啊...

1丶【那个弹窗能否增加回以前老版本的复制按钮啊...】

2丶【还有那个锁定按钮配合自动关闭开启的时候...】

3丶【还有就是能否显示的时候能否增加一个类似这样的中英对照模式...】
【一句话一句话翻译...】
复制识别
Copy identification
复制译文
Copy a translation

鉴定

此issue仅用于鉴定,鉴定完成后可删除

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.