For investors
股价:
5.36 美元 %For investors
股价:
5.36 美元 %认真做教育 专心促就业
一、什么是orc?
长沙安卓培训老师在网站上搜了一下,引用百度百科的介绍,指利用光学字符识别(ORC全称:Optical Character Recognition)技术,将图片、照片上的文字内容,直接转换为可编辑文本,支持JPG、PNG、GIF、BMP、DOC等图片格式。简单一句话,就是可以把图片上的文字识别出来。应用的场景有很多,比如说:身份证号码识别,银行卡号识别等等。
二、效果展示
这里笔者实现的仅仅是一个效果,实际使用可能需要对它进行训练以提高识别率,第一次做gif图片,效果不是很好
三、开始集成
Github上面已经提供了android端的工具api,Github地址:https://github.com/rmtheis/tess-two
集成流2
1.下载中文简体语言包
2.导入依赖
3.API的使用,获取TessBaseAPI mBaseAPI = new TessBaseAPI();实例
4.API的使用,初始化TessBaseAPI设置,设置识别的语言和语言包所在文件路径 mBaseAPI.init(path + File.separator, "chi_sim");
5.API的使用,设置Bitmap,mBaseAPI.setImage(bitmap);
6.API的使用,从Bitmap获取文字信息,mBaseAPI.getUTF8Text();
1.下载中文简体语言包
语言包下载地址
找到tessdata——>chi_sim.traineddata
下载好了之后,需要放到sd卡中,目录不限,但是必须要放在tessdata目录里面,如果没有tessdata目录需要手动创建,例如我是Demo中是放在sd卡根目录中,就直接在sd卡根目录创建tessdata目录,然后把下载好的chi_sim.traineddata语言包丢进去,实际项目中,在识别时候最好坐下语言包是否复制到位的检查,以免出现异常。Demo中仅仅是检查了是否创建tessdata目录,这里实际上仍然存在风险的。
2.导入依赖
Gradle方式添加
四、提高识别率
Demo识别率其实不是很理想,比如把数字0识别成了字母O等,这是因为我们的根本没有进行样本训练。关于样本的训练,我目前还没实际操作过,因为公司的识别需求更为复杂,这个框架难以达到效果,公司买了第三方的一个识别框架。不过仅仅是实现身份证号,银行卡号,和一些简单的文字信息,用这个框架足以实现。
免责声明:本文由长沙it培训小编转载自网络,旨在分享提供阅读,版权归原作者所有,如有侵权请联系我们进行删除。