• <small id='0EHlx'></small><noframes id='0EHlx'>

    <legend id='0EHlx'><style id='0EHlx'><dir id='0EHlx'><q id='0EHlx'></q></dir></style></legend>
    1. <tfoot id='0EHlx'></tfoot>
      <i id='0EHlx'><tr id='0EHlx'><dt id='0EHlx'><q id='0EHlx'><span id='0EHlx'><b id='0EHlx'><form id='0EHlx'><ins id='0EHlx'></ins><ul id='0EHlx'></ul><sub id='0EHlx'></sub></form><legend id='0EHlx'></legend><bdo id='0EHlx'><pre id='0EHlx'><center id='0EHlx'></center></pre></bdo></b><th id='0EHlx'></th></span></q></dt></tr></i><div id='0EHlx'><tfoot id='0EHlx'></tfoot><dl id='0EHlx'><fieldset id='0EHlx'></fieldset></dl></div>

        <bdo id='0EHlx'></bdo><ul id='0EHlx'></ul>

        Python实现OCR识别之pytesseract案例详解

        在处理图像识别的过程中,主要需要完成以下的任务:

            <bdo id='6halb'></bdo><ul id='6halb'></ul>
            <i id='6halb'><tr id='6halb'><dt id='6halb'><q id='6halb'><span id='6halb'><b id='6halb'><form id='6halb'><ins id='6halb'></ins><ul id='6halb'></ul><sub id='6halb'></sub></form><legend id='6halb'></legend><bdo id='6halb'><pre id='6halb'><center id='6halb'></center></pre></bdo></b><th id='6halb'></th></span></q></dt></tr></i><div id='6halb'><tfoot id='6halb'></tfoot><dl id='6halb'><fieldset id='6halb'></fieldset></dl></div>

            1. <small id='6halb'></small><noframes id='6halb'>

                <tbody id='6halb'></tbody>
              <legend id='6halb'><style id='6halb'><dir id='6halb'><q id='6halb'></q></dir></style></legend>
                <tfoot id='6halb'></tfoot>

                • Python实现OCR识别之pytesseract案例详解

                  介绍

                  在处理图像识别的过程中,主要需要完成以下的任务:

                  1. 去除图像中的背景噪音
                  2. 将图像转化为黑白图像
                  3. 图像分割
                  4. 字符识别

                  本文介绍了利用Python语言中的tesseract库来进行OCR识别的详细攻略。

                  安装

                  需要先安装tesseract库和pytesseract库。

                  1. 安装tesseract库
                  sudo apt-get install tesseract-ocr
                  sudo apt-get install libtesseract-dev
                  
                  1. 安装pytesseract库
                  pip3 install pytesseract
                  

                  示例1

                  在这个示例中,我们将使用一张包含文本的图片,并通过代码将其转换为文本。

                  try:
                      from PIL import Image
                  except ImportError:
                      import Image
                  import pytesseract
                  
                  # 打开图片
                  filename = 'sample.jpg'
                  image = Image.open(filename)
                  
                  # 识别文本,并存储在result变量中
                  result = pytesseract.image_to_string(image)
                  
                  # 打印输出结果
                  print(result)
                  

                  代码中首先导入了需要的库,然后打开了一个包含文本的图片。通过pytesseract库中的image_to_string函数,将图像中的文本转换为字符串。最终结果保存在result变量中,并通过打印输出展示出来。

                  示例2

                  在这个示例中,我们将使用pytesseract进行验证码识别。

                  try:
                      from PIL import Image
                  except ImportError:
                      import Image
                  import pytesseract
                  
                  # 打开图片,需要自己下载验证码图片
                  filename = 'code.png'
                  image = Image.open(filename)
                  
                  # 去除图像中的背景噪音
                  image = image.convert('L')
                  threshold = 200
                  table = []
                  for i in range(256):
                      if i < threshold:
                          table.append(0)
                      else:
                          table.append(1)
                  image = image.point(table, '1')
                  
                  # 分割图像
                  images = []
                  slices = [(5, 0, 13, 23), (19, 0, 27, 23), (33, 0, 41, 23), (47, 0, 55, 23)]
                  for slice in slices:
                      images.append(image.crop(slice))
                  
                  # 识别文本,并存储在result变量中
                  result = ''
                  for image in images:
                      result += pytesseract.image_to_string(image)
                  
                  # 打印输出结果
                  print(result)
                  

                  代码中首先导入了需要的库,然后打开了一个验证码图片。图像处理的过程中进行了去除背景噪音和图像分割的处理。最终通过pytesseract库中的image_to_string函数,将图像中的文本转换为字符串。最终结果保存在result变量中,并通过打印输出展示出来。

                  结论

                  通过本文,你可以了解如何使用Python中的pytesseract库来实现OCR识别的过程。其中包括了图片处理的过程和文本识别的细节。通过对本文示例代码的学习和实践,可以更好地掌握OCR识别的技能。

                  本站部分内容来源互联网,如果有图片或者内容侵犯了您的权益,请联系我们,我们会在确认后第一时间进行删除!

                  相关文档推荐

                  Python中有三个内置函数eval()、exec()和compile()来执行动态代码。这些函数能够从字符串参数中读取Python代码并在运行时执行该代码。但是,使用这些函数时必须小心,因为它们的不当使用可能会导致安全漏洞。
                  在Python中,下载网络文本数据到本地内存是常见的操作之一。本文将介绍四种常见的下载网络文本数据到本地内存的实现方法,并提供示例说明。
                  来给你详细讲解下Python 二进制字节流数据的读取操作(bytes与bitstring)。
                  Python 3.x 是 Python 2.x 的下一个重大版本,其中有一些值得注意的区别。 Python 3.0中包含了许多不兼容的变化,这意味着在迁移到3.0之前,必须进行代码更改和测试。本文将介绍主要的差异,并给出一些实例来说明不同点。
                  要在终端里显示图片,需要使用一些Python库。其中一种流行的库是Pillow,它有一个子库PIL.Image可以加载和处理图像文件。要在终端中显示图像,可以使用如下的步骤:
                  在Python中,我们可以使用Pillow库来进行图像处理。具体实现两幅图像合成一幅图像的方法如下:

                      • <bdo id='z9uI3'></bdo><ul id='z9uI3'></ul>

                      • <small id='z9uI3'></small><noframes id='z9uI3'>

                        <tfoot id='z9uI3'></tfoot>
                        • <i id='z9uI3'><tr id='z9uI3'><dt id='z9uI3'><q id='z9uI3'><span id='z9uI3'><b id='z9uI3'><form id='z9uI3'><ins id='z9uI3'></ins><ul id='z9uI3'></ul><sub id='z9uI3'></sub></form><legend id='z9uI3'></legend><bdo id='z9uI3'><pre id='z9uI3'><center id='z9uI3'></center></pre></bdo></b><th id='z9uI3'></th></span></q></dt></tr></i><div id='z9uI3'><tfoot id='z9uI3'></tfoot><dl id='z9uI3'><fieldset id='z9uI3'></fieldset></dl></div>
                            <tbody id='z9uI3'></tbody>
                            <legend id='z9uI3'><style id='z9uI3'><dir id='z9uI3'><q id='z9uI3'></q></dir></style></legend>