本软件程序支持简体中文识别和繁体中文横排和竖排的识别。
特色功能:
1.使用百度深度学习技术,识别正确率高。
2.一键繁简转换
3.一键错字替换,因为OCR识别出来总是会有一些固定误识的字,使用自定义替换表,可以提高工作效率。
4.双击恢复替换的字,有时10个里面有3个是不需要替换的,那么整体替换后,这三个双击鼠标可以复原。
5.体积小,免安装,使用简单。
横排文字的识别很简单,只需直接“打开图片”或者从剪贴板“粘贴图片”,然后点击“开始识别”按钮就能识别出来了。
然后繁体转简体,在右边下部的文本框内选中要转换的内容,然后点击“简繁”按钮就会在简体和繁体之间自动转换。
另外如果是竖排从右向左读的文字,那么识别设置要麻烦一些,请看如下使用说明。
前段时间想把一本竖排繁体中文的古书想转换成简体中文。从网上下载了汉王7600的识别程序,能识别竖排的,但识别率太低,只有不到一成。又网上找了其他的识别程序,发现没有合适的。正好看到百度有个图片ocr识别功能,能识别繁体字,识别率还可以,不是很清楚的图片也能达到九成左右。但百度提供的网页上不能识别竖排的,全部按横排识别。于是自己写了个小程序,调用百度的识别API,然后把图片自动切割成竖的一条条的来提交识别。识别好后再倒叙排一下。基本解决了这个问题。
现把程序贡献出来,供有需要的朋友使用。不过百度目前有每天免费识别500次的限额,满了后就要第二天识别了。
使用教程(竖排繁体字请看教程,横排的不论简体还是繁体,操作简单不看教程也能用)
1.程序启动后的界面
2.打开图片,或者从屏幕上截图,对于拍摄不是很平整的图片,可以分几块截图,分几次识别
截图后粘贴图片
3.粘贴好后如图:
4.点击 自动 按钮,来给竖排文本打标线,如果线条没有打出来或者只有一条,那么调整 “自动” 按钮前面的数字,默认是170,对于颜色深的图片可以调整到 100试试,这个数字越小表示空白部分的颜色越深。如图这个颜色深度,调整到120后标线就画出来了。
自动打的标线经常会位置不正确,会压到字,需要手工调整
调整水平起点和水平间隔的数字大小,使红色的线条位于文字的中间
5. 勾选 竖排按列提交,然后点击开始识别 按钮
6.这是按从左到右识别出来的文本
7.勾选自动替换错别字,替换的内容在 “错字替换.txt” 文件内,用记事本打开就可以修改。每组一行,错别字=正确的字 这样的格式
然后点击 “倒叙粘贴” 按钮,从上面倒叙复制到下面的窗口
8.完工
如果您电脑是XP系统,上述程序运行后报错,那么可以试试下载这个xp老版本
另外经过实测是否勾选“生僻字识别” 识别出来没什么区别。所以这个生僻字识别功能就去掉了。