golang 獲取字符串長度的案例

1.不同字符與獲取字符串長度

獲取字符串長度,是字符串操作的重要方法。理論來說,獲取字符串長度,隻要從頭到尾查找一遍就可以瞭。但遺憾的是,不同字符具有不同的編碼格式。拉丁字母一個字符隻要一個字節就行,而中文則可能需要兩道三個字節;UNICODE把所有字符設置為2個字節,UTF-8格式則把所有字符設置為1–3個字節。

因此,字符串長度的獲得,不等於按字節數查找,而要根據不同字符編碼查找。

2.golang中獲取字符串長度的方法

對於中文開發者來說,經常需要對字符串進行長度判斷。golang有自己的默認判斷長度函數len();但遺憾的是,len()函數判斷字符串長度的時候,是判斷字符的字節數而不是字符長度。因此,在中文字符下,應該采用如下方法:

1)使用 bytes.Count() 統計

2)使用 strings.Count() 統計

3)將字符串轉換為 []rune 後調用 len 函數進行統計

4)使用 utf8.RuneCountInString() 統計

3.樣例展示

s := "歡迎學習Go的len()函數"
r := []rune(strTest)
fmt.Println(len(r))
fmt.Println(len(s))
fmt.Println(bytes.Count([]byte(s), nil) - 1)
fmt.Println(strings.Count(s, "") - 1)
fmt.Println(utf8.RuneCountInString(s))

補充:Go語言獲取中英文混和字符串的長度以及子字符串的方法

1. 純英文字符串

使用len()函數。

testString1 := "China!"
length1 := len(testString1)
fmt.Printf("testString1 字符串的長度是:%d", length1)

長度是6。

2. 中英文混合字符串

2.1 先使用len()函數。

testString2 := "我愛你中國,我愛你China!"
length2 := len(testString2)
fmt.Printf("字符串的長度是:%d", length2)
fmt.Printf("testString2字符串的長度是:%d\n", length2)
fmt.Printf("testString2中的最後一個字符是:%s\n", testString2[length2-1])
fmt.Printf("testString2中的最後一個字符是:%c\n", testString2[length2-1])
fmt.Printf("testString2中的下標6-末尾的子字符串是:%s\n",testString2[:15])
fmt.Printf("testString2中的下標6-末尾的子字符串是:%s\n",testString2[:16])

這種方法的到的是字節數。Go語言中,中文字符按utf-8編碼,占3字節,故長度是31。故此方法不適用統計中英文混合或者中文字符串長度。

2.2 使用utf8.RuneCountInString()方法。

testString2 := "我愛你中國,我愛你China!"
length3 := utf8.RuneCountInString(testString2)
fmt.Printf("使用utf8中的方法統計的字符串長度是:%d\n", length3)

此方法可統計字符數,輸出結果是15。

2.3 轉成[]rune類型,再對此類型進行操作

testString2 := "我愛你中國,我愛你China!"
temp := []rune(testString2)
length4 := len(temp)
fmt.Printf("使用rune統計的字符串的長度是:%d\n", length4)
//獲取字符串中最後一個字符
lastChar := string(temp[length4-1])
//獲取下標從0到3(不包括3)的子串
subString1 := temp[0:3]
subString2 := temp[6:9]
fmt.Printf("testString2中的最後一個字符是:%s\n", lastChar)
fmt.Printf("testString2中的下標0-2的子字符串是:%s\n",string(subString1))
fmt.Printf("testString2中的下標6-8的子字符串是:%s\n",string(subString2))

此方法也可輸出字符個數15。但是此方法能獲取指定下標范圍的子字符串,也能獲取指定下標位置的字符。比第二種方法方便。

3.示例代碼

package main
import (
 "fmt"
 "unicode/utf8"
)
func main() {
 //純英文
 testString1 := "China!"
 length1 := len(testString1)
 fmt.Printf("testString1字符串的長度是:%d\n", length1)
 lastCharA := testString1[length1-1]
 //此處用%s格式輸出最後一個字符會出錯,隻能用%c
 fmt.Printf("testString1字符串中最後一個字符是:%s\n", lastCharA)
 fmt.Printf("testString1字符串中最後一個字符是:%c\n", lastCharA)
 fmt.Printf("testString1中的下標0-2的子字符串是:%s\n",testString1[0:3])
 fmt.Printf("testString1中的下標3-末尾的子字符串是:%s\n",testString1[3:])
 fmt.Println()
 //中英文加一起15個字符
 testString2 := "我愛你中國,我愛你China!"
 //此處長度是輸出字節數,Go語言中文字符是UTF-8編碼,長度3字節,故此處應該是15+1+9+6=31
 length2 := len(testString2)
 fmt.Printf("testString2字符串的長度是:%d\n", length2)
 fmt.Printf("testString2中的最後一個字符是:%s\n", testString2[length2-1])
 fmt.Printf("testString2中的最後一個字符是:%c\n", testString2[length2-1])
 fmt.Printf("testString2中的下標6-末尾的子字符串是:%s\n",testString2[:15])
 fmt.Printf("testString2中的下標6-末尾的子字符串是:%s\n",testString2[:16])
 fmt.Println()
 //此處就是統計字符數
 length3 := utf8.RuneCountInString(testString2)
 fmt.Printf("使用utf8中的方法統計的字符串長度是:%d\n", length3)
 fmt.Println()
 //轉成rune類型,再統計字符數
 temp := []rune(testString2)
 //獲取中英文混合字符串長度
 length4 := len(temp)
 fmt.Printf("使用rune統計的字符串的長度是:%d\n", length4)
 //獲取字符串中最後一個字符
 lastCharB := string(temp[length4-1])
 //獲取下標從0到3(不包括3)的子串
 subString1 := temp[0:3]
 subString2 := temp[6:]
 fmt.Printf("testString2中的最後一個字符是:%s\n", lastCharB)
 fmt.Printf("testString2中的下標0-2的子字符串是:%s\n",string(subString1))
 fmt.Printf("testString2中的下標6-末尾的子字符串是:%s\n",string(subString2))
}

4. 示例結果

總結

如果是對中英文進行操作,建議用第三種方式。先轉成rune[]型,再進行操作。

以上為個人經驗,希望能給大傢一個參考,也希望大傢多多支持WalkonNet。如有錯誤或未考慮完全的地方,望不吝賜教。

推薦閱讀: