软硬件环境
- ubuntu 18.04 64bit
- CUDA 10.1
- chineseocr_lite
- anaconda with python 3.7
- pytorch
视频看这里
此处是youtube
的播放链接,需要科学上网。喜欢我的视频,请记得订阅我的频道,打开旁边的小铃铛,点赞并分享,感谢您的支持。
简介
chineseocr_lite
是一个开源项目,使用了c++
和python
开发语言,用来实现中文的文字识别,支持竖排文字识别、繁体识别,总模型只有17M
(很小就是了),同时支持CPU
和GPU
,项目中集成了web
环境,部署起来也非常方便。
基本安装及使用
从官方网站下载源码,然后我们使用conda
创建一个新的python
虚拟环境,激活虚拟环境后开始安装chineseocr_lite
,相应的命令如下
git clone https://github.com/ouyanghuiyu/chineseocr_lite.git
cd chinesesocr_lite
conda create -n ocr python=3.7
conda activate ocr
pip install torch torchvision
pip install -r requirements.txt
pip install -U web.py
cd psenet/pse/
rm pse.so
make
python app.py 8090
这里需要注意下,requirements.txt
中指定的web.py
版本在运行的时候会报错,升级后就好了
至此,项目就已经安装好了,我们在浏览器中输入http://127.0.0.1:8090/ocr
可以看到,对竖排文字也是基本可以识别出来的
使用GPU加速
来到pytorch
的网站,https://pytorch.org/get-started/locally/,根据自己的环境进行选择,最后网站会出相应的安装命令,这点还是非常赞的
pip install torch==1.5.0+cu101 torchvision==0.6.0+cu101 -f https://download.pytorch.org/whl/torch_stable.html
安装好了以后,我们来到ipython
来验证一下
重新启动web
服务,device
那块的输出,如果看到的是cuda
而不是cpu
,那就说明已经可以使用gpu
了
(ocr) xugaoxiang@1070Ti:~/Works/github/chineseocr_lite$ python app.py 8090
make: Entering directory '/home/xugaoxiang/Works/github/chineseocr_lite/psenet/pse'
make: 'pse.so' is up to date.
make: Leaving directory '/home/xugaoxiang/Works/github/chineseocr_lite/psenet/pse'
device: cuda:0
load model
device: cuda:0
load model
device: cuda:0
load model
device: cuda:0
load model
http://0.0.0.0:8090/
经过测试,同样的图片,gpu
的识别花费时间只有cpu
的1/3,效果还是不错的