高效使用Go中的指针

0.125字数 673阅读 752

Go中的指针有两种,一种是内置类型uintptr,本质是一个整型,另一种是unsafe包提供的Pointer,表示可以指向任意类型的指针。通常uintptr用来进行指针计算,因为它是整型,所以很容易计算出下一个指针所指向的位置,而unsafe.Pointer用来进行桥接,用于不同类型的指针进行互相转换。

Go中也提供了unsafe.Pointer和uintptr使用的一些准则。

有了这些基本概念,我们可以怎么玩呢?

通常我们将byte[]转换成string是这样做的:

b := byte[]("Peppa")
string(b)

这个方式有个问题,就是会分配一份内存并进行拷贝,更高效的方式应该是不分配任何内存,在原有内存上进行类型转换。

slice 本质是一个结构体,里面含有指向底层数组的指针以及Len、Cap成员,通过reflect包可以看到slice是这样表示的:

type SliceHeader struct {
    Data uintptr
    Len  int
    Cap  int
}

其中Data是指向底层数组第一个元素的指针。byte slice之所以能在原有内存上转换成string是因为string结构和slice比较像,通过reflect包可以看到string是这样表示的:

type StringHeader struct {
    Data uintptr
    Len  int
}

所以我们只要在原始内存上构造出来StringHeader就可以了。

sh := reflect.StringHeader{
    uintptr(unsafe.Pointer(&b[0])),
    len(b),
}

其中Data指向的是slice的第一个元素,Len是slice的长度。这里使用unsafe.Pointer进行了桥接。
创建好StringHeader对象,下一步就是将其转换成string类型的对象,如何做呢?还是通过unsafe.Pointer进行桥接。

*(*string)(unsafe.Pointer(&sh))

先将StringHeader类型的指针转换到unsafe.Pointer,然后再将unsafe.Pointer转换成string类型的指针,最后通过指针取值获得实际的值。
这种通过unsafe.Pointer进行类型转换的方式在unsafe包中也进行了说明,其中举的例子就是math包中的Float64bits方法:

func Float64bits(f float64) uint64 {
    return *(*uint64)(unsafe.Pointer(&f))
}

我们可以验证两种方式是否重新分配了内存。

import (
    "github.com/davecgh/go-spew/spew"
    "unsafe"
    "reflect"
    "fmt"
)

func byteToString(b []byte) string {
    return string(b)
}

func byteToStringNoAlloc(b []byte) string {
    if len(v) == 0 {return ""}
    sh := reflect.StringHeader{uintptr(unsafe.Pointer(&b[0])), len(b)}
    return *(*string)(unsafe.Pointer(&sh))
}

func main() {
    b := []byte("Peppa")
    fmt.Println("切片第一个元素: ", spew.Sdump(&b[0]))

    str := byteToString(b)
    sh := (*reflect.StringHeader)(unsafe.Pointer(&str))
    fmt.Println("分配内存的方式: ", spew.Sdump(sh))

    strNoAlloc := byteToStringNoAlloc(b)
    shNoAlloc := (*reflect.StringHeader)(unsafe.Pointer(&toStr))
    fmt.Println("不分配内存的方式: ", spew.Sdump(shNoAlloc))
}

这种方式会带来一个比较严重的问题,Data指向的内存可能随时会被回收,因为uintptr是不安全的,所以当那段内存被回收后,这种在原始内存上进行转换的操作可能会导致panic,所以在使用这种方式时要保持警惕。

unsafe包也提供了安全的stringHeader和sliceHeader,不过它们没有暴露出来,所以暂时还没有办法避免内存不被回收的类型转换。

推荐阅读更多精彩内容