深入理解go slice結構

文章

slice介紹

append的機制

slice tricks

go data

slice

array的語法: [4]int{1,2,3,4}, [...]int{1,2,3}。在go中array是值類型,這就意味著一個類型為array的變量名並不是一個指針,當傳遞值是,array總是被復制。

slice的語法: []int{1,2,3,4}, make([]int), make([]int,10)

當make隻有兩個參數時,cap和len相同。

slice本質上是array的一個片段的描述,它包含3部分:
[ptr, len, cap]

通過make([]int, 5)創建的slice,其內存佈局如下:

在這裡插入圖片描述

對這個slice進行截斷之後,形成新的slice:

在這裡插入圖片描述

使用cap可以對slice進行擴增: s[:cap(s)].

copy(dst, src []T) int的用法: copy會復制dst和src中長度最小的元素所對應的數量(所以如果dst==nil, 則copy返回0)。並且,copy還能處理dst和src存在重疊的情況。
用法:

t := make([]byte, len(s), (cap(s)+1)*2)
copy(t, s)
s = t

append(dst []T, element...T) []T的實現,與下面的AppendByte類似:
首先檢查容量,容量不足則使用make構造一個新的slice並將原來的元素移動。

func AppendByte(slice []byte, data ...byte) []byte {
    m := len(slice)
    n := m + len(data)
    if n > cap(slice) { // if necessary, reallocate
        // allocate double what's needed, for future growth.
        newSlice := make([]byte, (n+1)*2)
        copy(newSlice, slice)
        slice = newSlice
    }
    slice = slice[0:n]
    copy(slice[m:n], data)
    return slice
}

slice對gc的影響(gotcha)

如果對一個很大的數組,取其中很小的一段切片,都會造成這個數組不會被gc回收。
gc使用mark-and-sweep(標記清除)。gc維護一個已分配的堆對象表,在標記階段,它將寄存器,堆棧上的指針作為root進行遍歷標記。

為什麼部分slice會導致整體的array不會回收呢?設想下面的slice:

a := [4]int{0,1,2,3}
s := a[1:2] // {1}
return s

a會不會被回收呢?答案是不會,因為gc遍歷s時,通過data指針找到對應的array切片,它發現這個地址在之前分配的一個array對象的范圍內,從而標記這個array為可到達對象,避免其被整個清除。(這裡所要理解的就是array是按范圍標記的,並不是按指針頭標記的,因為一個內存塊對象是有范圍的,如果被部分引用,說明整個對象仍然是可達的。)

如何解決?如果是這種情況,一個較大array返回較小切片,可以使用復制:

before:

var digitRegexp = regexp.MustCompile("[0-9]+")

func FindDigits(filename string) []byte {
    b, _ := ioutil.ReadFile(filename)
    return digitRegexp.Find(b)
}

after:

func CopyDigits(filename string) []byte {
    b, _ := ioutil.ReadFile(filename)
    b = digitRegexp.Find(b)
    c := make([]byte, len(b))
    copy(c, b)
    return c
}

reflect.SliceHeader

package reflect

// SliceHeader和StringHeader具有相同的Data和Len,這導致[]byte可以直接轉換成string,而不需要任何復制
type SliceHeader struct {
	Data uintptr
	Len  int
	Cap  int
}
type StringHeader struct {
	Data uintptr
	Len  int
}

轉換代碼:

func SliceByteAsString(b []byte) string {
    return *(*string)(unsafe.Pointer(&b))
}
func StringAsSliceByte(s string) []byte {
    p := unsafe.Pointer(&d)
    var b []byte
    hdr :=  (*reflect.SliceHeader)(unsafe.Pointer(&b))
    hdr.Data = uintptr(p)
    hdr.Cap = len(s)
    hdr.Len = len(s)
    return b
}

func Int64AsByteSlice(d int64) []byte {
    p := unsafe.Pointer(&d)
    var b []byte
    hdr :=  (*reflect.SliceHeader)(unsafe.Pointer(&b))
    hdr.Data = uintptr(p)
    hdr.Cap = 8
    hdr.Len = 8
    return b
}

到此這篇關於go slice結構的文章就介紹到這瞭,更多相關go slice結構內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!

推薦閱讀: