python PaddleOCR庫用法及知識點詳解

說明

1、PaddleOCR是基於深度學習的ocr識別庫,中文識別精度相當還不錯,能夠應對大多數文字提取需求。

2、需要依次安裝三個依賴庫,shapely庫可能會受到系統的影響,出現安裝錯誤。

安裝命令

pip install paddlepaddle
pip install shapely
pip install paddleocr

代碼實現

 ocr = PaddleOCR(use_angle_cls=True,)
# 輸入待識別圖片路徑
img_path = r"d:\Desktop\4A34A16F-6B12-4ffc-88C6-FC86E4DF6912.png"
# 輸出結果保存路徑
result = ocr.ocr(img_path, cls=True)
    for line in result:
        print(line)
 
from PIL import Image
image = Image.open(img_path).convert('RGB')
boxes = [line[0] for line in result]
txts = [line[1][0] for line in result]
scores = [line[1][1] for line in result]
im_show = draw_ocr(image, boxes, txts, scores)
im_show = Image.fromarray(im_show)
im_show.show()

內容擴展:

簡介

PaddleOCR旨在打造一套豐富、領先、且實用的OCR工具庫,助力使用者訓練出更好的模型,並應用落地。

近期更新

  • 2020.8.26 更新OCR相關的84個常見問題及解答,具體參考FAQ
  • 2020.8.24 支持通過whl包安裝使用PaddleOCR,具體參考Paddleocr Package使用說明
  • 2020.8.21 更新8月18日B站直播課回放和PPT,課節2,易學易用的OCR工具大禮包,獲取地址
  • 2020.8.16 開源文本檢測算法SAST和文本識別算法SRN
  • 2020.7.23 發佈7月21日B站直播課回放和PPT,課節1,PaddleOCR開源大禮包全面解讀,獲取地址
  • 2020.7.15 添加基於EasyEdge和Paddle-Lite的移動端DEMO,支持iOS和Android系統

特性

  • 超輕量級中文OCR模型,總模型僅8.6M
  • 單模型支持中英文數字組合識別、豎排文本識別、長文本識別
  • 檢測模型DB(4.1M)+識別模型CRNN(4.5M)
  • 實用通用中文OCR模型
  • 多種預測推理部署方案,包括服務部署和端側部署
  • 多種文本檢測訓練算法,EAST、DB、SAST
  • 多種文本識別訓練算法,Rosetta、CRNN、STAR-Net、RARE、SRN
  • 可運行於Linux、Windows、MacOS等多種系統

到此這篇關於python PaddleOCR庫用法及知識點詳解的文章就介紹到這瞭,更多相關python PaddleOCR庫的介紹內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!

推薦閱讀: