python PaddleOCR庫用法及知識點詳解
說明
1、PaddleOCR是基於深度學習的ocr識別庫,中文識別精度相當還不錯,能夠應對大多數文字提取需求。
2、需要依次安裝三個依賴庫,shapely庫可能會受到系統的影響,出現安裝錯誤。
安裝命令
pip install paddlepaddle pip install shapely pip install paddleocr
代碼實現
ocr = PaddleOCR(use_angle_cls=True,) # 輸入待識別圖片路徑 img_path = r"d:\Desktop\4A34A16F-6B12-4ffc-88C6-FC86E4DF6912.png" # 輸出結果保存路徑 result = ocr.ocr(img_path, cls=True) for line in result: print(line) from PIL import Image image = Image.open(img_path).convert('RGB') boxes = [line[0] for line in result] txts = [line[1][0] for line in result] scores = [line[1][1] for line in result] im_show = draw_ocr(image, boxes, txts, scores) im_show = Image.fromarray(im_show) im_show.show()
內容擴展:
簡介
PaddleOCR旨在打造一套豐富、領先、且實用的OCR工具庫,助力使用者訓練出更好的模型,並應用落地。
近期更新
- 2020.8.26 更新OCR相關的84個常見問題及解答,具體參考FAQ
- 2020.8.24 支持通過whl包安裝使用PaddleOCR,具體參考Paddleocr Package使用說明
- 2020.8.21 更新8月18日B站直播課回放和PPT,課節2,易學易用的OCR工具大禮包,獲取地址
- 2020.8.16 開源文本檢測算法SAST和文本識別算法SRN
- 2020.7.23 發佈7月21日B站直播課回放和PPT,課節1,PaddleOCR開源大禮包全面解讀,獲取地址
- 2020.7.15 添加基於EasyEdge和Paddle-Lite的移動端DEMO,支持iOS和Android系統
特性
- 超輕量級中文OCR模型,總模型僅8.6M
- 單模型支持中英文數字組合識別、豎排文本識別、長文本識別
- 檢測模型DB(4.1M)+識別模型CRNN(4.5M)
- 實用通用中文OCR模型
- 多種預測推理部署方案,包括服務部署和端側部署
- 多種文本檢測訓練算法,EAST、DB、SAST
- 多種文本識別訓練算法,Rosetta、CRNN、STAR-Net、RARE、SRN
- 可運行於Linux、Windows、MacOS等多種系統
到此這篇關於python PaddleOCR庫用法及知識點詳解的文章就介紹到這瞭,更多相關python PaddleOCR庫的介紹內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!
推薦閱讀:
- Python 圖片文字識別的實現之PaddleOCR
- Python利用PaddleOCR制作個搜題小工具
- PaddleOCR 識別表情包文字示例詳解
- python封裝json格式字符串並處理單雙引號問題
- python opencv通過4坐標剪裁圖片