编程语言中反射的概念
在计算机科学领域,反射是指一类应用,它们能够自描述和自控制。也就是说,这类应用通过采用某种机制来实现对自己行为的描述(self-representation)和监测(examination),并能根据自身行为的状态和结果,调整或修改应用所描述行为的状态和相关的语义。
每种语言的反射模型都不同,并且有些语言根本不支持反射。Golang语言实现了反射,反射机制就是在运行时动态的调用对象的方法和属性,官方自带的reflect包就是反射相关的,只要包含这个包就可以使用。
Golang的gRPC,json包都是通过反射实现的。
interface 和 反射
interface的wiki计划整理到这里: golang的interface
golang的变量分为两部分,type和value,value用的是指针word,type是rtype或者itab表示(itab是运行时动态生成的虚表)。itab主要是用来表示有方法的type的。
itab包含两个rtype,分别是static type和concrete type,而我们在interface类型断言中用到的是concrete type。
static type一般与golang的内置类型相关是创建变量时可以确定的,concrete type一般与用户定义的interface类型相关。
在实现时,golang的类型有通过接口Type和结构体rtype来定义,因为没有继承的概念,所以所以代码中都通过 *rtype这个“基类”来传递,实际使用的时候,通过t.Kind()判断rtype的类型,通过unsafe.Pointer把rtype转换为对应的Type的实现。
golang中反射的reflect.TypeOf(interface{})方法就可以获取Type类型,其具体实现如下:
// TypeOf returns the reflection Type that represents the dynamic type of i.
// If i is a nil interface value, TypeOf returns nil.
func TypeOf(i interface{}) Type {
eface := *(*emptyInterface)(unsafe.Pointer(&i)) //传入前已经有一次饮食类型转换把接口转换为空接口类型,src/runtime/iface.go中有隐式转换的代码。
return toType(eface.typ)
}
// toType converts from a *rtype to a Type that can be returned
// to the client of package reflect. In gc, the only concern is that
// a nil *rtype must be replaced by a nil Type, but in gccgo this
// function takes care of ensuring that multiple *rtype for the same
// type are coalesced into a single Type.
func toType(t *rtype) Type {
if t == nil {
return nil
}
return t
}
func (t *rtype) Elem() Type {
switch t.Kind() {
case Array:
tt := (*arrayType)(unsafe.Pointer(t))
return toType(tt.elem)
case Chan:
tt := (*chanType)(unsafe.Pointer(t))
return toType(tt.elem)
case Map:
tt := (*mapType)(unsafe.Pointer(t))
return toType(tt.elem)
case Ptr:
tt := (*ptrType)(unsafe.Pointer(t))
return toType(tt.elem)
case Slice:
tt := (*sliceType)(unsafe.Pointer(t))
return toType(tt.elem)
}
panic("reflect: Elem of invalid type")
}
//src/runtime/iface.go
func convT2E(t *_type, elem unsafe.Pointer) (e eface) {
if raceenabled {
raceReadObjectPC(t, elem, getcallerpc(), funcPC(convT2E))
}
if msanenabled {
msanread(elem, t.size)
}
x := mallocgc(t.size, t, true)
// TODO: We allocate a zeroed object only to overwrite it with actual data.
// Figure out how to avoid zeroing. Also below in convT2Eslice, convT2I, convT2Islice.
typedmemmove(t, x, elem)
e._type = t
e.data = x
return
}
没有找到从iface到eface的转换的完整过程,不过从_type,unsafe.Pointer到eface的转换应该包含了内存的分配和拷贝,这部分对于执行耗时的影响不大,只是可能会增大GC的压力。
断言的性能分析
先附上网上的一篇博客,https://blog.csdn.net/erlib/article/details/24197069。尝试对博客的测试进行细化。
首先在go1.10.2下更新下测试结果,从中可以看到switch带来的性能损耗在均值下还是存在的(虚表比较?约等于类型断言?),然后测试发现v interface{} 作为接收参数时,不会发生参数转换。
$ go test -test.bench=".*" ./reflect_benchmark_test.go
goos: darwin
goarch: amd64
Benchmark_TypeSwitch-4 100000000 19.6 ns/op
Benchmark_NormalSwitch-4 2000000000 1.69 ns/op
Benchmark_InterfaceSwitch-4 100000000 11.7 ns/op
Benchmark_InterfaceIn-4 2000000000 1.58 ns/op
PASS
ok command-line-arguments 10.055s
之后看下真正耗时的部分,也就是类型断言的代码,其中t.find执行了两遍,在未上锁执行了一遍,上锁又执行了一遍,测试发现时间影响确实不大,这样可以有效避免并发时对interface的修改?
func assertI2I(inter *interfacetype, i iface) (r iface) {
tab := i.tab
if tab == nil {
// explicit conversions require non-nil interface value.
panic(&TypeAssertionError{"", "", inter.typ.string(), ""})
}
if tab.inter == inter {
r.tab = tab
r.data = i.data
return
}
r.tab = getitab(inter, tab._type, false)
r.data = i.data
return
}
func getitab(inter *interfacetype, typ *_type, canfail bool) *itab {
if len(inter.mhdr) == 0 {
throw("internal error - misuse of itab")
}
// easy case
if typ.tflag&tflagUncommon == 0 {
if canfail {
return nil
}
name := inter.typ.nameOff(inter.mhdr[0].name)
panic(&TypeAssertionError{"", typ.string(), inter.typ.string(), name.name()})
}
var m *itab
// First, look in the existing table to see if we can find the itab we need.
// This is by far the most common case, so do it without locks.
// Use atomic to ensure we see any previous writes done by the thread
// that updates the itabTable field (with atomic.Storep in itabAdd).
t := (*itabTableType)(atomic.Loadp(unsafe.Pointer(&itabTable)))
if m = t.find(inter, typ); m != nil {
goto finish
}
// Not found. Grab the lock and try again.
lock(&itabLock)
if m = itabTable.find(inter, typ); m != nil {
unlock(&itabLock)
goto finish
}
// Entry doesn't exist yet. Make a new entry & add it.
m = (*itab)(persistentalloc(unsafe.Sizeof(itab{})+uintptr(len(inter.mhdr)-1)*sys.PtrSize, 0, &memstats.other_sys))
m.inter = inter
m._type = typ
m.init()
itabAdd(m)
unlock(&itabLock)
finish:
if m.fun[0] != 0 {
return m
}
if canfail {
return nil
}
// this can only happen if the conversion
// was already done once using the , ok form
// and we have a cached negative result.
// The cached result doesn't record which
// interface function was missing, so initialize
// the itab again to get the missing function name.
panic(&TypeAssertionError{concreteString: typ.string(), assertedString: inter.typ.string(), missingMethod: m.init()})
}
// find finds the given interface/type pair in t.
// Returns nil if the given interface/type pair isn't present.
func (t *itabTableType) find(inter *interfacetype, typ *_type) *itab {
// Implemented using quadratic probing.
// Probe sequence is h(i) = h0 + i*(i+1)/2 mod 2^k.
// We're guaranteed to hit all table entries using this probe sequence.
mask := t.size - 1
h := itabHashFunc(inter, typ) & mask
for i := uintptr(1); ; i++ {
p := (**itab)(add(unsafe.Pointer(&t.entries), h*sys.PtrSize))
// Use atomic read here so if we see m != nil, we also see
// the initializations of the fields of m.
// m := *p
m := (*itab)(atomic.Loadp(unsafe.Pointer(p)))
if m == nil {
return nil
}
if m.inter == inter && m._type == typ {
return m
}
h += i
h &= mask
}
}
从代码和流程来分析,以上基本包含了反射的基本流程,拿到一个Type接口的实现,之后根据这个Type类型再做的操作就没有特别耗时的了。
从代码可以看出可能存在的耗时主要在两方面,
1.大量值传递带来的gc压力(这个还不知道如何去分析所占的权重)
2.itab比较时,比较耗时。(这个根源是虚表是运行时动态生成的,interface接口继承关系太松散导致无法编译时解析?)
从reflect三法则看反射的用法:
从以下三条法则中,就可以看到反射的基本用法,具体可以自行仔细研究,本质都是基于Type接口的操作。
1.从接口值到反射对象的反射
2.从反射对象到接口值的反射
3.为了修改反射对象,其值必须可设置