chineseocr_lite – 超轻量级中文 OCR,本地文字识别工具

chineseocr_lite 是一个开源项目,用来实现中文的文字识别,支持竖排文字识别、繁体识别,总模型只有 17M(很小就是了),无需联网,支持 CPU 与 GPU,但需要自己部署。@Appinn

chineseocr_lite - 超轻量级中文 OCR,本地文字识别工具 1
Photo by Annie Spratt on Unsplash

目前绝大多数图片转文字,或者说中文 OCR 系统,都使用了云服务,也就是需要联网使用,这使得服务商有着大量的数据可以进行机器学习,而 chineseocr_lite 就有点厉害了:

超轻量级中文 ocr,支持竖排文字识别, 支持 ncnn 推理 , psenet(8.5M) + crnn(6.3M) + anglenet(1.5M) 总模型仅 17M

虽然说,青小蛙对上面的几个项目不是很熟(第一次见),但测试了一番,识别率还是可以的,这就行了。

chineseocr_lite - 超轻量级中文 OCR,本地文字识别工具 2
chineseocr_lite - 超轻量级中文 OCR,本地文字识别工具 3

如何安装?

chineseocr_lite 是一款需要自行编译、自行部署的开源软件(GitHub 开源),所以…有使用门槛!

必备环境:

  • Python
  • PyTorch(官网
  • VS2015(Windows 需要)

Linux 与 macOS 直接编译就好,青小蛙在想要不要搞成 Docker 方便大家用…想用的人多么?

编译也非常简单,只需要先复制源代码,然后跟着编译即可:

git clone https://github.com/ouyanghuiyu/chineseocr_lite.git
cd psenet/pse
rm -rf pse.so 
make

如何运行?

pip3 install -r requirements.txt
cd chineseocr_lite ## 进入chineseocr目录
python3 app.py 8080 ## 8080端口号,可以设置任意端口

上面的安装和运行两个步骤,对于新手会有不少的坑,所以你需要善用搜索引擎…总之青小蛙觉得这是一个能挡住 90% 普通用户的项目 🙈

如何使用?

在浏览器上输入 ip:8080 就能打开页面,然后加载图片进行识别了。并且还有 火车票身份证 两个单独识别选项。

0

37 条留言

  1. 听风就是雨 2020/03/22 回复
  2. 154798760 2020/03/23 回复
    • 青小蛙 2020/03/23 回复
  3. 喵星人 2020/03/23 回复
    • 青小蛙 2020/03/23 回复
    • notdiebird 2020/04/30 回复
  4. jyc860923 2020/03/23 回复
  5. randomcic 2020/03/23 回复
  6. yangweijie 2020/03/24 回复
  7. 老黑先生 2020/03/25 回复
    • 青小蛙 2020/03/26 回复
  8. 一缕阳光 2020/04/09 回复

写留言