1.cnocrcnocr是一个用于中文OCR的Python 3包。 cnocr 附带预先训练的识别模型,安装后即可使用。
cnocr 主要用于具有简单布局的打印文本图像,例如屏幕截图、扫描等。 cnocr 当前的内置文本检测和行分支模块无法处理复杂的文本布局安排。用于场景文本图像识别时,必须与其他场景文本检测引擎配合使用。
cnocr是Python3中的中英文OCR包,用pip命令安装后可以直接使用。
pip install cnocr==1.1.0V1.1.0 对代码做了很多修改,重写了大部分训练代码,生成了越来越难的训练和测试数据。与之前版本的模型相比,训练后的模型的准确性显着提高,尤其是在识别英语单词方面。
主要变化如下。
训练代码已更新为使用mxnet的Recordio先将数据转换为二进制格式,以提高后续训练效率。支持训练期间图像的实时数据丰富。还添加了可以传递的参数。训练集中的字符数可以更改,但目前中文为10个字符,英文为20个字符。您将有更多的模型选择,并且能够根据需要训练不同大小的不同识别模型。它包括多种预训练模型,其中最小的模型只有传统模型的1/5大小。所有型号均可免费使用。与之前的模型相比,识别准确率,特别是英语单词的识别准确率有了显着提高。新模型已经可以识别英语单词之间的空格。仅支持指定字符集中的文本识别。在一些纯数字或纯英文字符的应用场景下,可以提高识别率。优化支持黑底白字的多行文本图像。 mxnet 依赖项已升级到新版本。很多人反映mxnet 1.4.1经常丢失,无法安装,但现在已经升级到=1.5.0、1.7.0。该示例附带了一个模型,您可以直接使用。 cnocr的OCR模型可以分为两个阶段。第一阶段获取OCR图像的本地编码向量。在第二阶段,对OCR 图像进行序列学习。使用局部编码向量获得序列编码向量。当前两个阶段包括以下模型:
局部编码模型(emb模型) conv:多层卷积网络,conv-lite:小型多层卷积网络,densenet:小型密集网络,densenet-lite:小型密集网络。 2. 序列编码模型(seq model)
lstm:2层LSTM网络;gru:2层GRU网络;fc:2层全连接网络。
cnocr目前包含以下可以直接使用的模型:训练好的模型放在cnocr-models 项目中,可以免费下载使用。
github: https://github.com/breezededeus/cnocr
2.中文OCR开源项目是chineseocr_lite。目前比较常用的中文OCR开源项目是chineseocr,它基于YOLO V3和CRNN实现了中文自然场景的文本检测和识别。该项目目前拥有2500 颗星。本文介绍了另一个新的开源中文OCR 项目。这是一个基于chineseocr并改进的超轻量级汉字识别项目。
项目地址:https://github.com/ouyanghuiyu/chineseocr_lite
chineseocr_lite项目表示,与chineseocr相比,它使用了轻量级骨干网络PSENet、轻量级CRNN模型以及行文本方向分类网络AngleNet。支持竖排文字识别,支持ncnn推理,psenet(8.5M)+crnn(6.3M)+anglenet(1.5M),总模型仅17M。
目前,chineseocr_lite支持任意方向的文本检测,并在识别时自动确定行文本的方向。首先,让我们看一下项目创建者提供的示例效果。
chineseocr_lite 在水平和垂直文本识别方面都显示出出色的效果,并且其提供的交互式网页显示可以直接在页面上插入图像来调用识别模型。
标题:ocr开发包,ocr software
链接:https://www.7kxz.com/news/gl/19463.html
版权:文章转载自网络,如有侵权,请联系删除!