Python調用百度AI實現身份證識別
一、安裝baidu-aip模塊
按win+R打開cmd,在裡面輸入
pip3 install baidu-aip
若出現如下界面,即成功安裝瞭baidu-aip模塊:
如果想快速瞭解識別營業執照代碼原理,可以跳過第二部分,先看第三部分的內容。
二、獲取百度AI接口密鑰
在應用python識別身份證的過程中,有三行代碼使用瞭百度AI接口密鑰,故先闡述如何獲得該密鑰。首先,進入如下百度AI官方網站:https://ai.baidu.com/tech/ocr
有百度賬戶的輸入賬戶密碼進行登錄,沒有的點擊註冊,按指示輸入相關信息即可註冊登錄。
登錄後找到文字識別中的產品列表,下方有卡證文字識別內容,點擊瞭解詳情。
可以發現卡證文字識別中包含瞭我們常見的一些證件的識別,比如身份證、銀行卡、營業執照、戶口本、護照等。本文闡述營業執照的識別,感興趣的同學可以自行研究其它證件的識別。在卡證文字識別的詳情中可以發現如下產品列表:
找到身份證識別,點擊瞭解詳情,即可進入如下界面:
點擊立即使用,就會出現如下服務協議:
點擊我已同意百度AI開放平臺服務協議,就可以進入如下界面:
下滑後點擊卡證OCR,就可以發現身份證別功能,點擊開通按鈕。
可以進入如下篩選開通付費頁面:
在確認開通之前,要先進行實名驗證,按指示進行操作即可完成實名驗證。
接著可以勾選要開通的識別功能,具體如下:
然後點擊去支付,由於每天前多少次是免費的,且采取後付費模式,故不需提前付費。若開通成功,會出現如下界面:
開通成功後,點擊概覽中的創建應用。
填寫應用名稱(自己想一個貼合自己應用場景的名字即可)、選擇文字識別包名、選擇應用歸屬、填寫應用描述,點擊立即創建即可。
最後,點擊應用詳情,即可找到我們需要的接口密鑰(紅框對應的值)。
三、調用百度接口識別身份證
安裝好baidu-aip模塊,獲取瞭百度AI接口密鑰後,即可調用百度接口識別身份證瞭。身份證識別每天有5百次的免費調用機會,首先來看下今天要識別的身份證。
這張身份證是在百度上下載的一張虛擬身份證,如有侵權,請聯系我刪除。識別該身份證的具體python代碼如下:
import re import os import time from aip import AipOcr os.chdir(r'F:\公眾號\27.證件識別') #設置證件存放的路徑 APP_ID = 'XXX' API_KEY = 'XXXXXXXX' SECRET_KEY = 'XXXXXXXXXXXX' #百度賬號和密鑰,需替換成你的 picture = open('2_身份證_v3.jpg', 'rb') img = picture.read() #讀取圖片 idCardSide = 'front' #身份證正面 #idCardSide = 'back' #身份證反面 options = {} options['detect_direction'] = 'true' #是否檢測圖像朝向,默認不檢測 options['detect_risk'] = 'false' #是否開啟身份證風險類型 client = AipOcr(APP_ID, API_KEY, SECRET_KEY) text = client.idcard(img, idCardSide, options) #識別圖片中的信息 concat_text = [] if isinstance(text, dict): words = text['words_result'] for k, v in words.items(): print(u'{k}:{v}'.format(k=k, v=v['words'])) tt = u'{k}:{v}'.format(k=k, v=v['words']) concat_text.append(tt) #把字典解析成我們熟悉的形式
註:其中os.chdir中的內容應該替換成你存儲圖片的地址,APP_ID、API_KEY、SECRET_KEY應該替換成第二章末尾你獲取的百度密鑰。
得到結果如下:
對比原始圖片可以發現,出生是直接從身份證號碼中截取的,住址的信息可能由於反光沒有識別出來,結果為空。這裡有個小插曲,我之前一直使用png格式的身份證圖片進行調用識別,但一直報如下錯誤:
ConnectionError: ('Connection aborted.', ConnectionResetError(10054, '遠程主機強迫關閉瞭一個現有的連接。', None, 10054, None))
後面調整為jpg圖片後,就沒有出現該問題瞭,所以建議在進行身份證識別時最好把圖片的格式設置為jpg。為進一步規范輸出成標準格式,通過如下代碼進行規范化:
import pandas as pd date_concat_text = pd.DataFrame(concat_text) date_concat_text.columns =['text'] df = date_concat_text["text"].str.split(':',expand=True) date_concat_text['label'] = df.iloc[:,0] date_concat_text['content'] = df.iloc[:,1] date_concat_text.to_csv("id_card_to_text.csv")
得到結果如下:
以上就是Python調用百度AI實現身份證識別的詳細內容,更多關於Python識別身份證的資料請關註WalkonNet其它相關文章!
推薦閱讀:
- Python調用百度AI實現圖片上表格識別功能
- python爬蟲模擬登錄之圖片驗證碼實現詳解
- 十行Python代碼實現文字識別功能
- Java通過百度API實現圖片車牌號識別
- Python調用百度AI實現顏值評分功能