Python學習之字符串函數使用詳解
Python的友好在於提供瞭非常好強大的功能函數模塊,對於字符串的使用,同樣提供許多簡單便捷的字符串函數。Python 字符串自帶瞭很多有用的函數,在字符串函數之前先介紹一個非常實用的dir()內置函數,因為對每一個初學者還是大佬級別的python程序員,都不能完全記住所有方法。而該函數可以查看所有這些函數,可調用 dir 並將參數指定為任何字符串(如 dir(“”)),其返回值包括字符串可以使用的變量、方法和定義的類型。
>>> dir("") ['__add__', '__class__', '__contains__', '__delattr__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__getitem__', '__getnewargs__', '__gt__', '__hash__', '__init__', '__init_subclass__', '__iter__', '__le__', '__len__', '__lt__', '__mod__', '__mul__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__rmod__', '__rmul__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__', 'capitalize', 'casefold', 'center', 'count', 'encode', 'endswith', 'expandtabs', 'find', 'format', 'format_map', 'index', 'isalnum', 'isalpha', 'isdecimal', 'isdigit', 'isidentifier', 'islower', 'isnumeric', 'isprintable', 'isspace', 'istitle', 'isupper', 'join', 'ljust', 'lower', 'lstrip', 'maketrans', 'partition', 'replace', 'rfind', 'rindex', 'rjust', 'rpartition', 'rsplit', 'rstrip', 'split', 'splitlines', 'startswith', 'strip', 'swapcase', 'title', 'translate', 'upper', 'zfill']
其也提供對功能函數的查詢,比如經常使用的math()函數,所以無論是對後面所闡述的字符串函數還是其它函數,我們都可以用dir()內置函數來瞭解其它函數的類型、定義等等。下面所講述的字符串函數會區分其不同功能來分開介紹,其函數的實現功能大致包含以下六個功能:索引特殊字符串、設置字符格式、修改字符串大小寫、查看字符串特定格式、替換特定字符串、拆分特定字符串。
1 搜索字符串函數
假如我們需要在一段字符串中查找特定的子串時,通常涉及以下幾個函數:
雖然這幾個函數都實現瞭搜索特定字符串的功能,但還是包含一些區別的:
1. 函數 index 和 find 之間的差別在於沒有找到指定子串時的情形 ,示例如下:
函數index會拋出異常 ValueError,而如果沒有找到指定的子串,函數find將返回 -1。
2.字符串搜索函數通常從左往右(從開頭往末尾)搜索,但以 r 打頭的函數從右往左搜索。例如:
可以看到, 函數 find 和 index 返回傳入字符串第一次出現時的起始位置索引,而 rfind 和 rindex 返回傳入字符串最後一次出現時的起始位置索引。
2 設置字符串格式函數
下表列出瞭一些設置字符串格式的函數:
center(),ljust()和rjust()函數在日常用的使用很少,反倒是Python2.6以後的format()受到瞭廣大字符串處理者的使用。使用format函數需要給它提供變量或者值,一個簡單的例子:字符串中的 {0} 和 {1} 引用 format 的參數:它們將被替換為相應字符串或變量的值。也可以使用關鍵字參數的名稱,
>>> '{0} like eat {1}'.format('Wangzi','banana') 'Wangzi like eat banana' >>> '{who} {id} is Linda'.format(who='My',id='name') 'My name is Linda'
這是一些比較簡單的例子,還有更多細節方面的使用可以參考string — Common string operations — Python 3.10.1 documentation。下面舉一個在抓取jmx數值的實際使用案例。在大數據組件使用過程中,我們通常抓取jmx接口的數據獲取詳情,然後將數據接到相關的展示系統中來監控和展示:例如我們需要抓取一個隊列任務扥id,使用者,運行時間等指標值(此處IP做瞭處理,有問題可以咨詢博主)。
import json import urllib3 import re def get_ative_resourcemanager(rm1, rm2): http = urllib3.PoolManager() rm_list = [rm1, rm2] for resourcemanager in rm_list: url = 'http://{0}/ws/v1/cluster/info'.format(resourcemanager) response = http.request('GET', url) data = json.loads(response.data) ha_state = data['clusterInfo']['haState'] if ha_state == "ACTIVE": return resourcemanager '''Conversion time function''' # 毫秒級轉化為hour/minutes def conver_time(allTime): hours = (allTime/(60*60*1000)) return hours '''get active resourcemanager yarn application metrics''' def get_queue_metrics(): active_resoucemanager = get_ative_resourcemanager('ip1:port', 'ip2:port') http = urllib3.PoolManager() url = 'http://{0}/ws/v1/cluster/apps'.format(active_resoucemanager) response = http.request('GET', url) data = json.loads(response.data).get('apps').get('app') length = len(data) for i in range(length): '''判斷application狀態''' application_state = data[i]['state'] queue = data[i]['queue'] queue_name = re.findall(r'root.*',queue,re.IGNORECASE) #print(mobdi_queue) if (application_state == 'RUNNING' or application_state == 'ACCEPTED'): if queue_name: id_metric = data[i]['id'] user_metric = data[i]['user'] queue_metrics = data[i]['queue'] elapsed_time = data[i]['elapsedTime'] runtime_metric = conver_time(elapsed_time) print(str(id_metric) + " " + str(user_metric) + " " + str(queue_metrics) + " " + str(runtime_metric)) if __name__ == '__main__': '''''' get_queue_metrics()
執行結果:
3 改變字符串大小寫函數
提供改變字符串大小寫的函數有以下五個函數:
Python 提供瞭各種修改字母大小寫的函數,如上表。但註意標紅的地方,Python並沒有修改字符串,而是在這幾個函數中,創建並返回一個新字符串,並沒有真正修改string源字符串。
4 選定字符串函數
選定字符串函數通常用於刪除字符串開頭或者末尾多餘的字符串,具體有striip,lstrip和rstrip三個函數。
1.如果不加字符串,將刪除空白字符串:
2.刪除字符串情況:
5 拆分字符串函數
Python提供瞭以下幾個拆分字符串的函數,主要將字符串拆分成多個子串。
註意示例中存在string和string1兩個字符串,函數 partition 和 rpartition 將字符串拆分為3部分,這兩個函數總是返回一個這樣的值:由3個字符串組成, 形式為 (head, sep, tail) ;而函數 split 以指定字符串為分隔符,將 字符串劃分為一系列子串,返回一個字符串列表,列表總是分別以 [ 和 ] 打頭和結尾,並用逗號分隔元素。splitlines函數按照行(‘\r’, ‘\r\n’, \n’)分隔,返回一個包含各行作為元素的列表,使用很少,而且會自行判斷字符串是否包含換行符。
6 替換字符串函數
Python內置兩個字符串替換函數,包括:
到此這篇關於Python學習之字符串函數使用詳解的文章就介紹到這瞭,更多相關Python字符串函數內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!
推薦閱讀:
- python接口自動化使用requests庫發送http請求
- 關於python爬蟲應用urllib庫作用分析
- python urllib.request模塊的使用詳解
- Python爬蟲之urllib庫詳解
- python 如何用urllib與服務端交互(發送和接收數據)