python將中文數字轉化成阿拉伯數字的簡單方法
正則表達式提取文本中的數字
這裡演示一下文本中提取中文年份
import re m0 = "在一九四九年新中國成立比一九九零年低百分之五點二人一九九六年擊敗俄軍,取得實質獨立" pattrern1 = '[零一二三四五六七八九]{4,}' pattrern2 = '[〇一二三四五六七八九零壹貳叁肆伍陸柒捌玖貮兩]{4,}' time1 = re.findall(pattrern1,m0)#轉化數字
提取年份如:‘1949′, ‘1990′, ‘1996′
這裡給出許多正則表達式的樣例:example
中文轉化成阿拉伯數字
創建一個字典然後講數字進項匹配:
CN_NUM = { '〇': 0, '一': 1, '二': 2, '三': 3, '四': 4, '五': 5, '六': 6, '七': 7, '八': 8, '九': 9, '零': 0, '壹': 1, '貳': 2, '叁': 3, '肆': 4, '伍': 5, '陸': 6, '柒': 7, '捌': 8, '玖': 9, '貮': 2, '兩': 2,} for i in range(len(time1)): new_str = '' for j in time1[i]: new_str += str(CN_NUM[j]) time1[i] = new_str time1
這樣結果就出來啦,成功將上文例子中文年份轉化成阿拉伯數字:‘1949′, ‘1990′, ‘1996′
完整代碼
# 2、將句子中年份的大寫數字改為阿拉伯數字 import re m0 = "在一九四九年新中國成立比一九九零年低百分之五點二人一九九六年擊敗俄軍,取得實質獨立" pattrern1 = '[零一二三四五六七八九]{4,}' pattrern2 = '[〇一二三四五六七八九零壹貳叁肆伍陸柒捌玖貮兩]{4,}' time1 = re.findall(pattrern1,m0)#轉化數字 CN_NUM = { '〇': 0, '一': 1, '二': 2, '三': 3, '四': 4, '五': 5, '六': 6, '七': 7, '八': 8, '九': 9, '零': 0, '壹': 1, '貳': 2, '叁': 3, '肆': 4, '伍': 5, '陸': 6, '柒': 7, '捌': 8, '玖': 9, '貮': 2, '兩': 2,} for i in range(len(time1)): new_str = '' for j in time1[i]: new_str += str(CN_NUM[j]) time1[i] = new_str time1
總結
到此這篇關於python將中文數字轉化成阿拉伯數字的文章就介紹到這瞭,更多相關python中文數字轉阿拉伯數字內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!
推薦閱讀:
- python接口自動化之正則用例參數化的示例詳解
- Python正則表達re模塊之findall()函數詳解
- Python中re.findall()用法詳解
- Python進階篇之正則表達式常用語法總結
- Python re.findall中正則表達式(.*?)和參數re.S使用