5.1 字符串
不可变字节序列,本身是个复合结构
type stringStruct struct{
str unsafe.Pointer
len int
}
- 默认值是“”,空串
- 使用“ ' ”定义不做转义处理的原始字符串
- 支持操作符
- 允许索引号访问,但不能获取元素地址
- 切片内部,依然指向原字节数组
- 使用for遍历,分byte和rune两种方式,rune即处理unicode字符的类型
转换
修改字符串必须将其转换为可变类型[ ]rune或[ ]byte,完成后再转换回来。重新分配内存并复制数据
考虑到只读特性,转换时复制并新分配内存是可以理解的。但是编译器也会专门优化:
- [ ]byte转换为string key,去map[string]查询的时候
- string转换为[ ]byte, 进行for range迭代的时候,直接取字节复制给局部变量
性能
加法拼接,每次重新分配内存,性能较差
改进方法:
- strings.Join函数,统计所有长度,一次性完成分配
- bytes.Buffer,类似
Unicode
类型rune专门存储Unicode,是int32的别名,单引号标识
5.2 数组
- 对于数组,长度是类型组成的部分,不同长度的数组属于不同类型
- 初始化方式多样
- 定义多维数组时,仅第一维度允许...
- len和cap都返回第一维度长度
指针
获取数组变量的地址,可获取任意元素地址,可直接操作元素
复制
Go数组也是值类型,赋值和传参都会复制整个数组数据。
避免的方法是:指针或切片
切片
通过指针引用底层数组,将读写操作限定指定区域。
x[low, high, max]
len = high - low
cap = max - low
注:数组必须addressable,否则会错误
- 切片使用自己的索引访问元素内容
- 若直接创建切片,需要make或者显式初始化语句,以自动完成底层数组内存分配
- 有[...]的是数组,只有[]的是切片
- 可获取元素地址,但是不能像数组直接用数组指针访问元素内容
func main() {
s := []int{0, 1, 2, 3, 4}
p := &s
p0 := &s[0]
p1 := &s[1]
println(p, p0, p1)
(*p)[0] += 100
//*p += 100 错误!
*p0 += 100
*p1 += 100
fmt.Println(s)
}
- 切片是很小的结构体对象,用来代替数组传值,避免复制开销
- make函数允许运行期动态指定数组长度,绕开了数组类型必须使用编译器常量的限制
reslice
将切片视作[cap]slice数据源,据此创建新切片对象,不能超出cap
新建切片依旧指向原底层数组,修改对所有关联切片可见
append
向切片尾部添加数据,返回新的切片对象
数据被追加至原底层数组,如超出限制,则为新切片对象重新分配数据,(旧切片对象还用旧的数组)
- 新分配数组长度是原cap的2倍,而非原数组的2倍
- 大切片也有可能尝试扩容1/4
copy
在两个切片间复制对象,允许指向同一底层数组,允许目标区重叠,最终所复制的长度以较短切片的长度为准。
5.4 字典
- 引用类型,make或初始化语句来创建
- 访问不存在的键值,默认返回灵芝,推荐使用ok-idiom模式,有可能本身存的就是0呢
- 对字典迭代,次序是不同的不固定的
- 有len,没有cap,且not addressable
- 修改后重新设置value,或者用指针
- 不能对nil字典进行写,但是能读
- 空字典和nil是不同的
安全
- 有并发检测
- 可启用数据竞争来检查此类问题
- 可用sync.RWMutex实现同步
性能
5.5 结构
struct将多个不同类型命名字段field序列打包成一个复合类型。
- 顺序初始化或命名方式初始化
- 可用指针直接操作结构字段,但不能是多级指针
空结构
长度为零,底层指向runtime.zerobase变量
可用作通道元素类型,用于事件通知
匿名字段
没有名字,仅有类型,称作嵌入字段
从编译器角度,隐式的以类型名作为字段名字
- 如嵌入其他包中的类型,隐式字段名字不包括包名
- 不能将基础类型和其指针类型同时嵌入,因两者隐式名字相同
- 类似一种最小面向对象机制,不是继承,无法多态处理。
字段标签
不是注释!是对字段进行描述的元数据,运行期可用反射获取标签信息
内存布局
不管结构体包含多少字段,其内存总是一次性分配的,按定义顺序排列
对齐处理,以所有字段中最长的基础类型宽度为标准
空类型也会当做长度为1进行对其处理,使其地址不越界