Python 字符串操作詳情
1、字符串的定義
所謂字符串,就是由0個或者多個字符組成的有限序列。
在Python
程序中,如果我們把單個或多個字符用單引號”或者雙引號””包裹起來,就可以表示一個字符串,也可以用三個單引號或者雙引號進行折行。字符串的字符可以是特殊符號、英文字母、中文字符、日文的平假名或片假名、希臘字母、Emoji字符等等。
如下代碼展示瞭Python
中的字符串:
text1 = "這是用雙引號包裹的字符串" text2 = '這是用單引號包裹的字符串' text3 = """ 這一個是那個三個引號包裹的字符串 可以保留原來的格式 """ print(text1) print(text2) print(text3)
代碼運行結果如下:
這是用雙引號包裹的字符串
這是用單引號包裹的字符串這一個是那個三個引號包裹的字符串
可以保留原來的格式
2、轉義字符串和原始字符串
Python
中使用反斜杠“”
來表示轉義,也就是說後面的內容就不會是原始的內容瞭,例如\n
則表示換行,而不再表示和字符n
瞭;所以如果字符串本身包含瞭 '、"、
這些特殊的字符,必須要通過“進行轉義處理。
示例代碼如下所示:
text1 = "\'Hello world\'" # 輸出被單引號包裹的Hello world text2 = '\\Hello world\\' # 輸出被兩個反斜線包裹的Hello world print(text1) print(text2)
下面展示瞭python
中的一些轉義字符:
原始字符串是Python
中一類比較特殊的字符串,以大寫字母R或者小寫字母r
開始。在原始字符串中,字符“\”
不再表示轉義字符的含義。
示例代碼如下所示:
text1 = "古之立大事者,\n不惟有超世之才,\n亦必有堅忍不拔之志" text2 = r"古之立大事者,\n不惟有超世之才,\n亦必有堅忍不拔之志" print(text1) print(text2)
運行代碼如下所示:
古之立大事者,
不惟有超世之才,
亦必有堅忍不拔之志
古之立大事者,\n不惟有超世之才,\n亦必有堅忍不拔之志
3、字符串的運算
Python
為字符串類型提供瞭非常多的運算符
3.1 拼接運算符
使用+運算符來實現字符串的拼接,使用*運算符來重復一個字符串的內容
text1 = "Hello,world" text2 = "!" print(text1 + text2) # Hello,world! print(text2 * 10) # !!!!!!!!!!
用*實現字符串的重復是很重要,比如要打印一個分隔線如果寫成—————會很麻煩的,但是如果用- * 20就很簡單瞭
3.2 成員運算
Python
中可以用in和not in
判斷一個字符串中是否存在另外一個字符或字符串,in
和not in
運算通常稱為成員運算,會產生佈爾值True
或False
text1 = "Hello,world" text2 = "一碗周" print("llo" in text1) # True print("周" not in text2) # False print("粥" not in text2) # True
4、獲取字符串長度
通過內置函數len()
來獲取字符的長度
text1 = "Hello,world" text2 = "一碗周" print(len(text1)) # 11 print(len(text2)) # 3
5、索引和切片
如果在字符串中引用某個字符,可以對字符從進行索引運算(註:Python的索引值是從0開始的),運算符是[n],其中n是一個整數,假設字符串的長度為N,那麼n可以是從0到N-1的整數,其中0是字符串中第一個字符的索引,而N-1是字符串中最後一個字符的索引,通常稱之為正向索引;在Python
中,字符串的索引也可以是從-1到-N的整數,其中-1是最後一個字符的索引,而-N則是第一個字符的索引,通常稱之為負向索引。
值得註意的是,因為字符串是不可變類型,所以不能通過索引運算修改字符串中的字符。
text1 = "Hello,world" text2 = "一碗周" N1 = len(text1) N2 = len(text2) # 獲取第一個字符 print(text1[0], text1[-N1]) # H H print(text2[0], text2[-N2]) # 一 一 # 獲取最後一個字符 print(text1[N1 - 1], text1[-1]) # d d print(text2[N2 - 1], text2[-1]) # 周 周 # 獲取索引為2和-2的字符 print(text1[2], text1[-2]) # l l print(text2[2], text2[-2]) # 周 碗
註意:如果索引越界(即索引值不在索引范圍內)會引起錯誤,例如
print(text2[222])
錯誤信息如下:
IndexError: string index out of range # (字符串索引超出范圍)
如果要取出多個字符,要對字符串進行切片,運算符是[i:j:k]
,其中i是開始索引,索引對應的字符可以不能取到N-1或者-1;j是結束索引,索引對應的字符不能取到0或者-N;k是步長,默認值為1,表示從前向後獲取相鄰字符的連續切片(可以省略),如果k的值為正數,即為正向索引;如果k的值為負數,即為負向索引。
s = '123456789abcdef,一碗周' # i=3, j=6, k=1的正向切片操作 print(s[3:6]) # 456 # i=-17, j=-14, k=1的正向切片操作 print(s[-17:-14]) # 456 # i=16, j=默認, k=1的正向切片操作 print(s[16:]) # 一碗周 # i=-4, j=默認, k=1的正向切片操作 print(s[-3:]) # 一碗周 # i=8, j=默認, k=2的正向切片操作 print(s[8::2]) # 9bdf一周 # i=-12, j=默認, k=2的正向切片操作 print(s[-12::2]) # 8ace,碗 # i=默認, j=默認, k=2的正向切片操作 print(s[::2]) # 13579bdf一周 # i=默認, j=默認, k=1的正向切片 print(s[:]) # 123456789abcdef,一碗周 # i=1, j=-1, k=2的正向切片操作 print(s[1:-1:2]) # 2468ace,碗 print("-"*20) # i=7, j=1, k=-1的負向切片操作 print(s[7:1:-1]) # 876543 # i=-13, j=-19, k=-1的負向切片操作 print(s[-13:-19:-1]) # 876543 # i=8, j=默認, k=-1的負向切片操作 print(s[8::-1]) # 987654321 # i=默認, j=1, k=-1的負向切片操作 print(s[:15:-1]) # 周碗一 # i=默認, j=默認, k=-1的負向切片 print(s[::-1]) # 周碗一,fedcba987654321 # i=默認, j=默認, k=-2的負向切片 print(s[::-2]) # 周一fdb97531
i的默認值為最開始的那個數,j的默認值為結束的那個數(包括本身)
值得註意的是,返回的字符串是包括i不包括j的。
6、字符串的方法
在Python
中使用字符串的類型自帶的方法對字符串進行處理和操作,對於一個字符串類型的變量,使用變量名.方法名()的方式來調用它的方法。所謂方法其實就是跟某個類型的變量綁定的函數。
6.1 轉換大小寫
s1 = 'hello, world!' # 使用capitalize方法獲得字符串首字母大寫後的字符串 print(s1.capitalize()) # Hello, world! # 使用title方法獲得字符串每個單詞首字母大寫後的字符串 print(s1.title()) # Hello, World! # 使用upper方法獲得字符串大寫後的字符串 print(s1.upper()) # HELLO, WORLD! s2 = 'GOODBYE' # 使用lower方法獲得字符串小寫後的字符串 print(s2.lower()) # goodbye
6.2 查找操作
如果想在一個字符串中從前向後查找有沒有另外一個字符串,可以使用字符串的find
或index
方法。
s = 'hello, world!'
# find方法從字符串中查找另一個字符串所在的位置 # 找到瞭返回字符串中另一個字符串首字符的索引 print(s.find('or')) # 8 # 找不到返回-1 print(s.find('shit')) # -1 # index方法與find方法類似 # 找到瞭返回字符串中另一個字符串首字符的索引 print(s.index('or')) # 8 # 找不到引發異常 print(s.index('shit')) # ValueError: substring not found
在使用find
和index
方法時還可以通過方法的參數來指定查找的范圍,就是不必從索引0的位置開始。“find和index方法還有逆向查找(從後向前查找)的版本,分別是rfind
和rindex
`
s = 'hello good world!' # 從前向後查找字符o出現的位置(相當於第一次出現) print(s.find('o')) # 4 # 從索引為5的位置開始查找字符o出現的位置 print(s.find('o', 5)) # 7 # 從後向前查找字符o出現的位置(相當於最後一次出現) print(s.rfind('o')) # 12
6.3性質判斷
可以通過字符串的startswith
、endswith
來判斷字符串是否以某個字符串開頭和結尾;還可以用is開頭的方法判斷字符串的特征,這些方法都返回佈爾值。
s1 = 'hello, world!' # startwith方法檢查字符串是否以指定的字符串開頭返回佈爾值 print(s1.startswith('He')) # False print(s1.startswith('hel')) # True # endswith方法檢查字符串是否以指定的字符串結尾返回佈爾值 print(s1.endswith('!')) # True s2 = 'abc123456' # isdigit方法檢查字符串是否由數字構成返回佈爾值 print(s2.isdigit()) # False # isalpha方法檢查字符串是否以字母構成返回佈爾值 print(s2.isalpha()) # False # isalnum方法檢查字符串是否以數字和字母構成返回佈爾值 print(s2.isalnum()) # True
6.4格式化字符串
在Python中,字符串類型可以通過center
、ljust
、rjust
方法做居中、左對齊和右對齊的處理。
s = 'hello, world' # center方法以寬度20將字符串居中並在兩側填充* print(s.center(20, '*')) # ****hello, world**** # rjust方法以寬度20將字符串右對齊並在左側填充空格 print(s.rjust(20)) # hello, world # ljust方法以寬度20將字符串左對齊並在右側填充~ print(s.ljust(20, '~')) # hello, world~~~~~~~~
Python2.6
開始,新增瞭一種格式化字符串的函數 str.format()
,它增強瞭字符串格式化的功能。
基本語法是通過 {}
和 :
來代替以前的 %
。
a = 111 b = 222 print('{0} + {1} = {2}'.format(a, b, a + b)) # 111 + 222 = 333 c = "hello" d = "world" # 不設置指定位置,按默認順序 print("{} {}".format(c, d)) # hello world print("{0} {1}".format(c, d)) # hello world print("{1} {0}".format(d, c)) # hello world print("{1} {0} {1}".format(c, d)) # world hello world
從Python 3.6
開始,格式化字符串還有更為簡潔的書寫方式,就是在字符串前加上f來格式化字符串,在這種以f打頭的字符串中,{變量名}是一個占位符,會被變量對應的值將其替換掉。
a = 111 b = 222 print(f"{a} + {b} = {a + b}") # 111 + 222 = 333 c = "hello" d = "world" print(f"{c} {d}") # hello world
對數字格式化的多種操作
分別是居中、左對齊、右對齊,後面帶寬度,:號後面帶填充的字符,隻能是一個字符,不指定則默認是用空格填充。
+
表示在正數前顯示+
,負數前顯示 -
; (空格)表示在正數前加空格 b、d、o、x 分別是二進制、十進制、八進制、十六進制。
7、修剪操作
strip()
方法用於移除原字符串修剪掉左右指定的字符(默認為空格或換行符)或字符序列。這個方法非常有實用價值,通常用來將用戶輸入中因為不小心鍵入的頭尾空格去掉,strip
方法還有lstrip
(即left strip)和rstrip
(即right strip)兩個版本。
s = ' 一碗周 \t\n' # strip方法獲得字符串修剪左右兩側空格之後的字符串 print(s.strip()) # 一碗周 s1 = "!!!一碗周!!!" print(s1.lstrip("!")) # 一碗周!!! print(s1.rstrip("!")) # !!!一碗周
到此這篇關於Python 字符串操作詳情的文章就介紹到這瞭,更多相關Python 字符串操作內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!
推薦閱讀:
- 關於Python中字符串的各種操作
- pandas中對文本類型數據的處理小結
- Python學習之str 以及常用的命令
- Python中字符串對象語法分享
- Python字符串對齊、刪除字符串不需要的內容以及格式化打印字符