golang中的切片的索引是左闭右开的,切片不存储数据,它是对数组的引用,其他切片可以跟它共享同一个底层的数组,所以切片的其实是数组的别名。
a[1:4] 表示切片中的三个元素a[1],a[2],a[3]
slice可以看作是一个包含指针(指向底层数组)、切片中元素的个数以及切片容量的一个struct。指向相同源数组的切片指针指向相同,容量相同,但是输出元素不同,这与切片的长度有关系。重新切片同一个切片指针只能向后修改,则前面的元素将被删除。
// 切片a包含5个元素[1, 2, 3,4,5]
a := []int{1, 2, 3, 4, 5}
// 重新切片之后元素变为[2, 3, 4, 5],第一个元素已经被删除,不能访问到第一个元素
a = a[1:]
对于使用append函数进行元素扩充时,如果当前的容量不足以存放需要增加的元素,则将生成一个新的满足容量需求的切片,如果容量满足要求,则继续用之前的切片。新切片的生成规则是容量变为原来的2倍。如果是nil切片,则会变成2。
package main
import "fmt"
func main() {
a := []int{1, 2}
fmt.Printf("cap = %d, slice = [%v], addr = [%p]\n", cap(a), a, a)
a = append(a, 3)
fmt.Printf("cap = %d, slice = [%v], addr = [%p]\n", cap(a), a, a)
var b []int
fmt.Printf("cap = %d, slice = [%v], addr = [%p]\n", cap(b), b, b)
b = append(b, 0)
fmt.Printf("cap = %d, slice = [%v], addr = [%p]\n", cap(b), b, b)
}
Output:
cap = 2, slice = [[1 2]], addr = [0x10410020]
cap = 4, slice = [[1 2 3]], addr = [0x10410040]
cap = 0, slice = [[]], addr = [0x0]
cap = 2, slice = [[0]], addr = [0x10410060]
如果切片引用了一个包含整个文件数据的数组,那么如果你仅仅需要其中一部分数据,但是整个文件数据仍然在内存中,除非没有切片引用它,才会被GC回收。
// 返回的新切片仍然引用原始的数组,最好的办法就是copy将需要的数据进行复制,这样就不会导致一大堆无用的数据留在内存中。
var digitRegexp = regexp.MustCompile("[0-9]+")
func FindDigits(filename string) []byte {
b, _ := ioutil.ReadFile(filename)
return digitRegexp.Find(b)
}
// 使用copy改进如下
func CopyDigits(filename string) []byte {
b, _ := ioutil.ReadFile(filename)
b = digitRegexp.Find(b)
c := make([]byte, len(b))
copy(c, b)
return c
}
// 使用append改进如下
func CopyDigits(filename string) []byte {
b, _ := ioutil.ReadFile(filename)
b = digitRegexp.Find(b)
var c []byte
return append(c, b...)
}
如何避免gotchas