python pytesseract庫的實例用法
說明
1、pytesseract需要與安裝在本地的tesseract-ocr.exe文件一起使用。
2、需要註意的是,安裝時必須選擇中文包,默認隻支持英文識別。
安裝命令
pip install pytesseract
實例
import pytesseract from PIL import Image text = pytesseract.image_to_string(Image.open(r"d:\Desktop\39DEE621-40EA-4ad1-90CC-79EB51D39347.png")) print(text)
識別結果輸出
Using Tesseract OCR with Python # import the necessary packages from PIL import Image import pytesseract import ergperse import cv2 import os # construct the argument parse and parse the arguments ap = argparse.ArgunentParser() ap.add_argument("-i", "--image", required-True, help="path to input image to be OCR'd") ap.add_argument("-p", "--preprocess", typesstr, default="thresh", helpe"type of preprocessing to be done") args = vars (ap.parse_args())
實例擴展:
Python使用pytesseract庫識別圖片文字
準備
首先需在本機安裝Tesseract客戶端,然後安裝pytesseract庫:
pip install pytesseract
沒安裝過PIL的也要安裝一下,因為所調用的第一個參數是由Image類返回:
pip install PILLOW
實例
import pytesseract from PIL import Image img = Image.open("D://aa.jpg") text = pytesseract.image_to_string(img, lang="chi_sim") print(text)
到此這篇關於python pytesseract庫的實例用法的文章就介紹到這瞭,更多相關python pytesseract庫是什麼內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!
推薦閱讀:
- 如何利用Python識別圖片中的文字詳解
- 如何使用Python進行PDF圖片識別OCR
- python簡單驗證碼識別的實現過程
- Opencv 圖片的OCR識別的實戰示例
- 利用Python提取PDF文本的簡單方法實例