简介
PandaOCR是一款个人开发的集文本翻译、图片OCR识别、截图OCR识别、文本转语音、剪切OCR识别等功能于一体的功能强大的OCR识别软件,自从2018年上线以来作者完全是在用爱发电为大家一直默默的更新着这款OCR识别软件。PandaOCR 内置多个OCR引擎接口有百度OCR、搜狗OCR、有道OCR和腾讯OCR。语音朗读引擎有搜狗朗读、腾讯朗读、百度朗读、必应朗读和讯飞合成。
软件功能
支持识别引擎:搜狗OCR/API+腾讯OCR/API+百度OCR/API+有道OCR/API+京东OCR
支持翻译引擎:搜狗翻译/API+腾讯翻译/API+百度翻译/API+有道翻译/API+谷歌翻译+词霸翻译+必应翻译+沪江翻译+剑桥翻译+奇虎翻译+海词翻译+彩云翻译
支持朗读引擎:搜狗朗读+腾讯朗读+百度朗读+必应朗读+讯飞朗读+谷歌朗读+京东朗读
支持快捷键和屏幕边角触发截图识别功能,方便快速
支持截取识别固定区域,例如可帮助翻译英文游戏/软件中的单词或队友聊天记录
支持右侧小弹窗显示信息,快速查看识别/翻译内容
支持智能合并修正识别/翻译文本,让排版更合理
支持设置最多十条固定截图规则,让一键识别更方便快捷
支持监听图像和文本复制操作,快速识别图像文本或翻译复制文本
支持简单的窗口汉化功能,帮助翻译纯英文类软件界面文字
还有很多奇怪的没有列在程序界面上的功能,可以编辑程序目录下的Config.ini文件试试
更新日志
增加 百度OCR 演示版
增加 腾讯OCR API版(高精度 | 精简版 | 高速版 | 手写版 4个接口)
增加 有道OCR 演示版备用接口
增加 京东OCR 演示版备用接口
增加 阿里OCR API版(高精度 | 手写版 | 多语种 3个接口)
增加 自动复制 功能项(复制两者+逐行)
增加 文本转换 菜单项(增加更多常用的转换功能)
增加 上传文本 菜单项(UBUNTU接口)
增加 DPI参数 配置项(0=默认 | 1或2使用不同的方式禁用系统DPI | 3=在不禁用系统DPI的前提下解决高分屏下截图被放大的问题)
增加 更多提示 引导用户转用同样免费但更稳定的API版接口
增加 上传图床 京东接口
修复 京东OCR 演示版
修复 腾讯OCR API版(通用识别接口语言参数错误)
修复 百度翻译 演示版
修复 欧路翻译 演示版
修复 朗读引擎(腾讯 | 搜狗 | 百度 | NaverTTS)
修复 解二维码 图像区菜单项功能
修复 文本纠错 文本区菜单项功能
修复 在WIN10某些版本系统下程序内无法显示遮罩的问题
修复 禁用热键 导致使用按钮截图识别功能失效
调整 边角触发截图 配置项 默认禁用
优化 反馈窗口(重新设计界面,支持直接匿名反馈或跳转至网页反馈)
优化 程序运行逻辑
[捐助版专享]:增加 屏幕识别翻译 功能(截图后翻译并将翻译图像叠加至原文位置)操作演示
[捐助版专享]:增加 图文批量识别 支持音效提示(任务完成后播放提示音)
[捐助版专享]:增加 图文批量识别 支持增量保存(将识别内容保存为单个文件)
[捐助版专享]:增加 图文批量识别 增量保存名称(在增量保存中在识别文本前添加文件名)
[捐助版专享]:增加 图文批量识别 支持自动关机(任务完成后自动关闭电脑)
优化 识别文本和翻译文本对繁体的支持
优化 双击复制和文本监听功能在翻译文本后将不重新排版
优化 程序运行逻辑提高性能
优化 微调界面 强迫症不会容许任何一个像素跑错它应该存在的位置
增加 双击窗口空白处可切换至全屏界面
增加 窗口背景颜色 配置项(0=银白 | 1=亮色 | 2=暗色 | 3=暗色(需配合暗色系统主题) | 也支持自定其他十进制颜色数值如:15000804)
增加 任务结束点击 配置项(0=禁用 | 启用后将在识别完成后自动点击屏幕上指定位置,比如继续游戏剧情 | 格式:X坐标|Y坐标|点击次数|点击方式 | 点击方式:1=全屏坐标 2=焦点窗口坐标 | 例:10|10|1|1)
增加 弹窗位置 配置项(0=居中 | 1=左侧 | 2=右侧)
增加 网校OCR(API版接口 | 支持识别中英+拼音+公式 | 官网已转到好未来网站)
增加 弹窗版本 配置项(0=默认 | 1=透明背景且无鼠标穿透 | 2=增量显示文本内容(适合游戏或电影字幕机翻))
增加 代理地址 配置项(0=禁用 | 设置HTTP代理地址和端口即启用 | 例:127.0.0.1:1082)
修复 搜狗翻译 演示版(有时翻译错乱的问题)
修复 小牛翻译 演示版
修复 PAPAGO翻译 演示版
修复 网校OCR 演示版(因网站变更,临时性修复)
修复 MathpixOCR(同时配置文件“MathpixOCR_KEY格式”注释存在错误,应改为:ID | KEY)
修复 有道翻译_KEY 配置项注释(应改为:ID | KEY)
修复 固定截图热键 可能导致部分WIN10系统下闪退的问题(旧版本可将此配置项改为0禁用解决)
[捐助版专享]:增加 按键数字音效 配置项(0=禁用 | 1-6=启用 | 启用后将在按下小键盘区的数字键时播报独立的数字音效)
[捐助版专享]:增加 图文批量识别 支持设置识别指定位置的图像(0=禁用 | 格式:左边|顶边|宽度|高度 | 示例:10|10|150|150)
[捐助版专享]:增加 图文批量识别 支持使用全部版本的API接口
[捐助版专享]:优化 图文批量识别 功能(压缩识别图像 | 显示失败提示 | 增加重试延迟)
增加 主窗大小调整 配置项(0=默认 | 默认:1060×570 | 如果启用请设置大于默认的数值 | 例:1280×720)
增加 新窗查看 同步文本区滚动条位置(左同步至右)
增加 识别和翻译 内置繁中语言(ZHT | 不支持的引擎会自动转为ZH简中)
增加 新的捐助方式(中间那个)
修复 有道翻译 API版中的潜在问题
调整 鼠标双击文本区可启用横排对比模式(并隐藏图像区)
调整 恢复使用 检查版本 配置项,当设为0时,只有1/5的机率会在发现新版时弹窗提示(缓解你的强迫症)
[捐助版专享]:优化 屏显按键功能(解决按键偶尔消失的问题)
[捐助版专享]:优化 图文批量识别(增加失败自动重试,双击路径编辑框可以打开目录)
[捐助版专享]:增加 按键音效功能(启用后将在按键时播放音效 | 目前内置三种音效,如果喜欢考虑再增加 | 全部效果)
[捐助版专享]:增加 按键音效类型 配置项(1-3 | 选择不同类型的音效)
[捐助版专享]:增加 按键音效音量 配置项(1-100 | 调整播放音量)
[捐助版专享]:增加 图文批量识别 支持排版合并文本
[捐助版专享]:增加 PDF转换图片(将PDF文件转换为图片格式)
增加 腾讯OCR 优图API版接口(通用版+手写版+高性能+高精度)
增加 百度OCR API版接口(高精度+手写版+网图版)
增加 讯飞OCR API版接口(通用版+手写版+多语种)
增加 搜狗OCR API版接口(高精度 | 支持横竖屏)
增加 公式识别 API版接口(讯飞公式识别)
增加 退出保存配置 配置项(0=禁用 | 1=启用 | 启用后将在程序正常退出时自动将当前设置保存至配置文件)
优化 多线程稳定性,尝试避免偶尔闪退或无响应的问题
优化 历史记录 鼠标移入时显示所需的位置以减少误触
调整 各API版接口的ID和KEY配置格式(示例:ID | KEY)
调整 自动保存文本 功能改为顺序文本保存(旧版为倒序)
修复 百度OCR 演示版
修复 腾讯翻译 演示版因COOKIES过期导致的翻译错误问题
修复 在XP系统下无法更改高级设置的兼容问题
修复 在文本框内按下CTRL+回车键进行翻译时被添加换行的问题
[捐助版专享]:增加 屏显按键 功能(启用后将在屏幕中显示当前按键)
[捐助版专享]:增加 图文批量识别 功能(此功能只限使用API版接口)
增加 薪火OCR 演示版
增加 SpaceOCR API版
增加 高级设置 界面可使用ESC键关闭
增加 弹窗版本 配置项 | 实验性功能
优化 划词复制 初始化导致的截图卡顿
优化 配置文件 注释内容
修复 GDI截图 时鼠标指针异常
修复 双击复制 初始化问题
修复 上传图床 两个接口错误
增加 阿里OCR(演示版和API版)
增加 腾讯OCR(腾讯云新版API接口 | 保留腾讯AI旧版API接口)
增加 金山OCR(演示版)
增加 公式识别(阿里公式演示版 | 腾讯云公式API版 | Mathpix公式API版,无KEY未经过测试)
增加 表格识别(阿里表格演示版和API版 | 腾讯云表格API版)
增加 禁用热键(托盘图标右键菜单)
增加 弹窗热键 配置项(0=禁用 | 使用热键显示或隐藏弹窗 | 示例:F3键 或 CTRL+F3键 | 最多支持两个键组合)
增加 显示固定截图规则的独立热键
修复 搜狗图床(与因使用了此图床进行图像搜索的引擎可能失效的问题)
修复 灵云翻译(演示版)
优化 百度翻译API版(当来源语言和目标语言同为中文时自动将目标语言改为英文)
优化 历史记录 功能
优化 双击复制 功能
优化 默认配置将启用历史记录功能(游戏机翻用户建议禁用)
增加 表格识别(有道表格识别演示版)
增加 公式识别(网校公式识别演示版 )
增加 易道OCR(演示版)
增加 语音识别(演示版 | 识别图像区右键菜单)
增加 截图组件 选择项(1=画板截图 | 2=GDI截图 | 3=高级截图 | 4=调用外部截图工具 【教程】)
增加 历史记录 配置项(0=禁用 | 1=启用 | 启用后需将鼠标移入识别图像区上层可显示 | 此功能可能会略微增加内存使用量)
增加 图像抠图 功能(识别图像区右键菜单)
修复 搜狗OCR(演示版,也可以自行更改配置:搜狗OCR版本=2)
修复 讯飞OCR(演示版,优先使用多语种识别,如失效将自动切换至简单中英识别)
修复 小牛翻译(演示版)
修复 表格识别 的下载表格功能异常
去除 腾讯OCR(腾讯优图_演示版,此版本需登陆,使用不便几乎也没人用故去除)
调整 程序界面,将其他设置改名为高级设置并分离至单独区域,并增加多个功能更改组件
增加 表格识别(只支持API版,目前内置百度表格API接口,识别后不会直接显示,将显示表格下载地址,右键菜单可下载)
增加 多个OCR(演示版:灵云OCR | 飞桨OCR | 合合OCR | 网校OCR)
增加 灵云翻译(演示版)
增加 划词复制 配置项(0=禁用 | 1=启用 | 配合启用监听文本并翻译得到划词翻译功能)
增加 强制显示窗口 配置项(0=禁用 | 1=启用 | 启用后将在识别完成后强行显示主窗口)
增加 恢复焦点窗口 配置项(0=禁用 | 1=焦点窗口 | 2=顶端窗口 | 启用后将在识别后恢复识别前的焦点窗口)
增加 切换引擎接口的同时将重新识别或翻译
调整 讯飞OCR更改为多语种版(自动识别语言,支持日文)
调整 因公式和表格识别与文字识别不属于同一类型,所以分开为单独的两个选择项目,但API接口使用和OCR同样的ID和KEY配置
增加 必应OCR(演示版,只支持英文,且图片不能太小)
增加 讯飞OCR(演示版,只支持中英)
增加 阿里翻译(演示版)
增加 云译翻译(演示版)
增加 欧路翻译(演示版)
增加 Deepl翻译(演示版暂不可用,单纯增加API版接口,且未购买KEY测试)
增加 文本替换 配置项(替换指定内容,示例:apple#Apple|google#Google)
增加 文本区分隔线(位于两个文本区中间,拖动可改变文本区高度,双击隐藏图像区,右键单击恢复)
增加 双击复制 配置项(0=禁用 | 1=翻译文本 | 2=识别图像 | 3=自动选择翻译或识别 | 连按两次CTRL+C键后程序将根据设置自动翻译或识别)
增加 朗读内容 配置项(之前朗读内容与自动朗读共用一个配置参数导致不易理解,现独立分开)
修复 YandexOCR(防滥用机制太强,不推荐使用)
修复 奇虎翻译
修复 京东朗读
修复 必应翻译
修复 彩云小译
修复 有道翻译 返回文本格式错误
修复 启用监听复制功能时手动复制操作可能出现死循环的问题
修复 启用监听复制功能时在Adobe Reader内复制文本可能卡壳的问题
去除 加载动画 多余效果(现在只有启用或禁用)
优化 功能选择文本便于理解
优化 翻译语言参数
下载地址
历史上的今天:
- 2022: 著名漫画软件笔趣阁漫画 v1.0.64(0)
感谢站长分享,终于找到这么好的OCR是识别软件了