Golang中的Interface詳解

背景:

golang的interface是一種satisfied式的。A類隻要實現瞭IA interface定義的方法,A就satisfied瞭接口IA。更抽象一層,如果某些設計上需要一些更抽象的共性,比如print各類型,這時需要使用reflect機制,reflect實質上就是將interface的實現暴露瞭一部分給應用代碼。要理解reflect,需要深入瞭解interface。go的interface是一種隱式的interface,但golang的類型是編譯階段定的,是static的,如:

type MyInt int
var i int
var j MyInt

雖然MyInt底層就是int,但在編譯器角度看,i的類型是int,j的類型是MyInt,是靜態、不一致的。兩者要賦值必須要進行類型轉換。即使是interface,就語言角度來看也是靜態的。如:

var r io.Reader

不管r後面用什麼來初始化,它的類型總是io.Reader。更進一步,對於空的interface,也是如此。記住go語言類型是靜態這一點,對於理解interface/reflect很重要。看一例:

var r io.Reader
tty, err := os.OpenFile("/dev/tty", os.O_RDWR, 0)
if err != nil {
    return nil, err
}
r = tty

到這裡,r的類型是什麼?r的類型仍然是interface io.Reader,隻是r = tty這一句,隱含瞭一個類型轉換,將tty轉成瞭io.Reader。

interface的實現:

作為一門編程語言,對方法的處理一般分為兩種類型:一是將所有方法組織在一個表格裡,靜態地調用(C++, java);二是調用時動態查找方法(python, smalltalk, js)。而go語言是兩者的結合:雖然有table,但是是需要在運行時計算的table。如下例:Binary類實現瞭兩個方法,String()和Get()

type Binary uint64
func (i Binary) String() string {
    return strconv.Uitob64(i.Get(), 2)
}
  
func (i Binary) Get() uint64 {
    return uint64(i)
}

因為它實現瞭String(),按照golang的隱式方法實現來看,Binary satisfied瞭Stringer接口。因此它可以賦值: s:=Stringer(b)。以此為例來說明下interface的實現:interface的內存組織如圖:

一個interface值由兩個指針組成,第一個指向一個interface table,叫 itable。itable開頭是一些描述類型的元字段,後面是一串方法。註意這個方法是interface本身的方法,並非其dynamic value(Binary)的方法。即這裡隻有String()方法,而沒有Get方法。但這個方法的實現肯定是具體類的方法,這裡就是Binary的方法。
當這個interface無方法時,itable可以省略,直接指向一個type即可。
另一個指針data指向dynamic value的一個拷貝,這裡則是b的一份拷貝。也就是,給interface賦值時,會在堆上分配內存,用於存放拷貝的值。
同樣,當值本身隻有一個字長時,這個指針也可以省略。
一個interface的初始值是兩個nil。比如,

var w io.Writer

這時,tab和data都是nil。interface是否為nil取決於itable字段。所以不一定data為nil就是nil,判斷時要額外註意。

這樣,像這樣的代碼:

switch v := any.(type) {
case int:
    return strconv.Itoa(v)
case float:
    return strconv.Ftoa(v, 'g', -1)
}

實際上是any這個interface取瞭  any. tab->type。

而interface的函數調用實際上就變成瞭:

s.tab->fun[0](s.data)。第一個參數即自身類型指針。

itable的生成:

itable的生成是理解interface的關鍵。

如剛開始處提的,為瞭支持go語言這種接口間僅通過方法來聯系的特性,是沒有辦法像C++一樣,在編譯時預先生成一個method table的,隻能在運行時生成。因此,自然的,所有的實體類型都必須有一個包含此類型所有方法的“類型描述符”(type description structure);而interface類型也同樣有一個類似的描述符,包含瞭所有的方法。

這樣,interface賦值時,計算interface對象的itable時,需要對兩種類型的方法列表進行遍歷對比。如後面代碼所示,這種計算隻需要進行一次,而且優化成瞭O(m+n)。

可見,interface與itable之間的關系不是獨立的,而是與interface具體的value類型有關。即(interface類型, 具體類型)->itable。

var any interface{}  // initialized elsewhere
s := any.(Stringer)  // dynamic conversion
for i := 0; i < 100; i++ {
    fmt.Println(s.String())
}

itable的計算不需要到函數調用時進行,隻需要在interface賦值時進行即可,如上第2行,不需要在第4行進行。

最後,看一些實現代碼:

以下是上面圖中的兩個字段。

type iface struct {
    tab  *itab     // 指南itable
    data unsafe.Pointer     // 指向真實數據
}

再看itab的實現:

type itab struct {
    inter  *interfacetype
    _type  *_type
    link   *itab
    bad    int32
    unused int32
    fun    [1]uintptr // variable sized
}

可見,它使用一個疑似鏈表的東西,可以猜這是用作hash表的拉鏈。前兩個字段應該是用來表達具體的interface類型和實際擁有的值的類型的,即一個itable的key。(上文提到的(interface類型, 具體類型) )

type imethod struct {
    name nameOff
    ityp typeOff
}

type interfacetype struct {
    typ     _type
    pkgpath name
    mhdr    []imethod
}

interfacetype如有若幹imethod,可以猜想這是表達interface定義的方法數據結構。

type _type struct {
    size       uintptr
    ptrdata    uintptr // size of memory prefix holding all pointers
    hash       uint32
    tflag      tflag
    align      uint8
    fieldalign uint8
    kind       uint8
    alg        *typeAlg
    // gcdata stores the GC type data for the garbage collector.
    // If the KindGCProg bit is set in kind, gcdata is a GC program.
    // Otherwise it is a ptrmask bitmap. See mbitmap.go for details.
    gcdata    *byte
    str       nameOff
    ptrToThis typeOff
}

對於_type,可見裡面有gc的東西,應該就是具體的類型瞭。這裡有個hash字段,itable實現就是掛在一個全局的hash table中。hash時用到瞭這個字段:

func itabhash(inter *interfacetype, typ *_type) uint32 {
    // compiler has provided some good hash codes for us.
    h := inter.typ.hash
    h += 17 * typ.hash
    // TODO(rsc): h += 23 * x.mhash ?
    return h % hashSize
}

可見,這裡有個把interface類型與具體類型之間的信息結合起來做一個hash的過程,這個hash就是上述的itab的存儲地點,itab中的link就是hash中的拉鏈。

回到itab,看取一個itab的邏輯:

如果發生瞭typeassert或是interface的賦值(強轉),需要臨時計算一個itab。這時會先在hash表中找,找不到才會真實計算。

     h := itabhash(inter, typ)

     // look twice - once without lock, once with.
     // common case will be no lock contention.
     var m *itab
     var locked int
     for locked = 0; locked < 2; locked++ {
         if locked != 0 {
             lock(&ifaceLock)
         }
         for m = (*itab)(atomic.Loadp(unsafe.Pointer(&hash[h]))); m != nil; m = m.link {
             if m.inter == inter && m._type == typ {
                 return m    // 找到瞭前面計算過的itab
             }
         }
     }
    // 沒有找到,生成一個,並加入到itab的hash中。
     m = (*itab)(persistentalloc(unsafe.Sizeof(itab{})+uintptr(len(inter.mhdr)-1)*sys.PtrSize, 0, &memstats.other_sys))
     m.inter = inter
     m._type = typ
     additab(m, true, canfail)

這個hash是個全局變量:

 const (
     hashSize = 1009
 )

 var (
     ifaceLock mutex // lock for accessing hash
     hash      [hashSize]*itab
 )

最後,看一下如何生成itab:

     // both inter and typ have method sorted by name,
     // and interface names are unique,
     // so can iterate over both in lock step;
     // the loop is O(ni+nt) not O(ni*nt).       // 按name排序過的,因此這裡的匹配隻需要O(ni+nt)
     j := 0
     for k := 0; k < ni; k++ {
         i := &inter.mhdr[k]
         itype := inter.typ.typeOff(i.ityp)
         name := inter.typ.nameOff(i.name)
         iname := name.name()
         for ; j < nt; j++ {
             t := &xmhdr[j]
             tname := typ.nameOff(t.name)
             if typ.typeOff(t.mtyp) == itype && tname.name() == iname {
                     if m != nil {
                         ifn := typ.textOff(t.ifn)
                         *(*unsafe.Pointer)(add(unsafe.Pointer(&m.fun[0]), uintptr(k)*sys.PtrSize)) = ifn // 找到匹配,將實際類型的方法填入itab的fun
                     }
                     goto nextimethod
                 }
             }
         }
     nextimethod:
     }
     h := itabhash(inter, typ)             //插入上面的全局hash
     m.link = hash[h]
     atomicstorep(unsafe.Pointer(&hash[h]), unsafe.Pointer(m))
 }

到這裡,interface的數據結構的框架。

reflection實質上是將interface背後的實現暴露瞭一部分給應用代碼,使應用程序可以使用interface實現的一些內容。隻要理解瞭interface的實現,reflect就好理解瞭。如reflect.typeof(i)返回interface i的type,Valueof返回value。

以上就是這篇文章的全部內容瞭,希望本文的內容對大傢的學習或者工作具有一定的參考學習價值,謝謝大傢對WalkonNet的支持。

推薦閱讀: