如何在Windows上安装tesserocr?


问题内容

我下载了tesseract-
OCR的可执行文件并安装了它。另一方面,我还从http://www.leptonica.com/download.html下载了leptonica的zip文件。它包括两个目录,分别是libinclude

接下来,我尝试pip install tesserocr在python virtualenvironment中进行操作,但返回错误

 tesserocr.cpp(460) : fatal error C1083: Cannot open include file: 'leptonica/allheaders.h': No such file or directory

我注意到,allheaders.hinclude从我先前下载的leptonica文件目录。我该如何解决?我应该在哪里放置的目录includelib我从leptonica,使这项工作?

还有其他方法可以在Windows计算机上正确安装tesseract-ocr和使用tesserocr吗?目前,我正在使用Windows
10运行使用tesseract-ocr识别图像上某些字符的python脚本。我还计划稍后在Windows 7计算机上运行脚本。

感谢您的帮助。


问题答案:

使用AnacondaTesserOCR在名为环境中安装OCR

  1. 这里安装Windows版Anaconda
  2. 打开Anaconda提示:

conda create -n OCR python=3.6

activate OCR

  1. 对于tesseract 3.5.1(稳定):

conda install -c simonflueckiger tesserocr

针对tesseract 4.0.0(实验性):

conda install -c simonflueckiger/label/tesseract-4.0.0-master tesserocr

此处下载与Windows平台和Python安装相匹配的wheel文件,并通过以下方式进行安装:

pip install <path_to_your_wheel_file>