手摸手Go 深入理解sync.Map

日常开发过程中,map结构应该登场率是较为频繁的。但是Go的内建map类型并不是协程安全的。如下面这个栗子,如果业务开发过程中不注意很容易中招。

func main() {
    m := make(map[int]int)
    go func() {
        for {
            m[0] = 1
        }
    }()
    go func() {
        for {
            if v, ok := m[0]; ok {
                fmt.Println(v)
            }
        }
    }()
    ch := make(chan os.Signal)
    signal.Notify(ch, os.Interrupt)
    <-ch
}

声明一个map[int]int用两个协程去同时操作一个key,得到panic

fatal error: concurrent map read and map write

为了解决这种问题,我们有几个选择

  1. 使用Go1.9sync包下引入了并发安全的mapsync.Map功能上跟map[interface{}]interface{}很像,但是sync.Map是协程安全的,并通过读写分离的机制,降低锁的粒度,提高并发性能。
  2. 使用第三方的类库concurrent-map(https://github.com/orcaman/concurrent-map)

今天我们先来聊聊sync.Map,本文基于go1.15.7

基本使用

让我们用sync.Map来改写上面的栗子

func main() {
    m := sync.Map{}
    go func() {
        for {
            m.Store(0, 1)
        }
    }()
    go func() {
        for {
            if v, ok := m.Load(0); ok {
                fmt.Println(v)
            }
        }
    }()
    ch := make(chan os.Signal)
    signal.Notify(ch, os.Interrupt)
    <-ch
}

另外,sync.Map还支持RangeDelete方法

m.Range(func(key, value interface{}) bool {
  fmt.Println(key, value)
  return true
})
m.Delete(0)

sync.Map源码分析

数据结构

先看下sync.Map的数据结构

type Map struct {
    mu Mutex
 //  持有部分map的数据并且并发读不需要持有锁,但是改变指针需要持有锁
    read atomic.Value // readOnly
  // 包含部分map数据需要持有锁保护 为了保证dirty map能够快速晋升为read map,
  // 它还包含所有在read map未清除的数据
  // expunged数据不会存储在dirty map
  // 如果dirtymap为nil则下一次写会从read map拷贝一份数据
    dirty map[interface{}]*entry
  // 记录从read map中读不到数据,加锁去判断key是否存在的次数
  // 当misses等于dirty map长度时,dirty map会直接晋升为read map
  // 下次写操作再从read map拷贝一份数据
    misses int
}

sync.Map中的 read实际指向的是readOnly结构体对象

// readOnly 是一个不可变结构体 自动存储在Map.read字段中
type readOnly struct {
    m       map[interface{}]*entry
    amended bool // 如果key在dirty不在m中 则为true如果为false则表示dirty为空
}

// map中的key 指向的value
type entry struct {
  // p指向interface{}类型的值
  // 如果p==nil,表明entry已经被删除并且m.dirty==nil
  // 如果p==expunged,表明entry已经被删除且m.dirty!=nil 并且entry不在m.dirty中
  // 否则entry是有效的并且记录m.read.m[key] 并且如果m.dirty!=nil 则也存在m.dirty[key]
  // 当m.dirty重建的时候被删除的entry会被检测到并自动由nil替换为expunged 并且不会设置m.dirty[key]
  // 若p!=expunged,则entry关联的值可以通过原子替换来更新
  // 若p==expunged,则需要先设置m.dirty[key]=e之后才能更新entry关联的值,这样以便使用dirty map查找值
    p unsafe.Pointer // *interface{}
}
sync map

操作方法

Load操作

Load操作返回存储在map中指定key的value,有两个返回值,ok表示key对应的value是否存在。

func (m *Map) Load(key interface{}) (value interface{}, ok bool) {
    read, _ := m.read.Load().(readOnly)
    e, ok := read.m[key]
    if !ok && read.amended {
        m.mu.Lock()
    // double-check 避免我们获得锁期间 ditry map已经晋升为了read map
        read, _ = m.read.Load().(readOnly)
        e, ok = read.m[key]
        if !ok && read.amended {//不存在 且map.dirty包含了部分不在read map中的数据
            e, ok = m.dirty[key]
      //记录miss 当前这个key会一直执行slow path直到dirty map晋升为read map
            m.missLocked()
        }
        m.mu.Unlock()
    }
    if !ok {
        return nil, false
    }
    return e.load()
}

因为sync.Map设计了一个read map和一个dirty map。他俩的区别在于

  • read map指向了readOnly结构体对象,readOnly结构体本身是只读的 但是read map指向的引用是可变的
  • dirty map是一个结构为map[interface{}]*entry的内建map类型

让他俩之间产生关联的是sync.Map 中的misses字段。为什么呢?让我们看看Load的具体过程:

  1. 首先从read map中尝试读取数据,若read map中不存在且read.amended为true(注释:当存在数据存在dirty map但不在read map中时read.amended为true)则尝试获得锁
  2. 获得锁后,并没有直接从dirty map中拿数据,而是进行了double-check,再次从read map中尝试获取数据,为何要这么做呢?我们接着看。
  3. double-check之后发现还是没有拿到数据,那么此时就从dirty map中获取,然后执行missLocked()这个方法很关键,我们来看看它的实现
func (m *Map) missLocked() {
    m.misses++
    if m.misses < len(m.dirty) {
        return
    }
    m.read.Store(readOnly{m: m.dirty})
    m.dirty = nil
    m.misses = 0
}

missLocked()方法首先针对m.misses++递增操作(这里已获得锁,协程安全),这里也印证了misses字段的含义:记录从read map中读不到数据,加锁去判断key是否存在的次数。接着是重头戏

如果m.misses小于m.dirty的长度直接返回,但是如果大于或者等于,则会将m.dirty的引用包装成readOnly结构并更新给read map并将m.dirty置为nil,m.misses置为0。(注意:这里read.amended为false时,m.dirty为nil 事实也是这样)

到这里你应该能理清楚,read mapdirty map以及misses之间的关系:

dirty read map

所以刚刚的double-check就很好理解了,因为第一次从read map查找数据到加锁成功之间,有可能dirty map已经完成了read map 的晋升过程。

  1. Load()的最后一步,查找数据,则调用entry.load()获取数据。
func (e *entry) load() (value interface{}, ok bool) {
    p := atomic.LoadPointer(&e.p)
    if p == nil || p == expunged {
        return nil, false
    }
    return *(*interface{})(p), true
}

Store操作

Store()操作在key存在并且value不处于expunged状态下会覆盖原有的值

// Store sets the value for a key.
func (m *Map) Store(key, value interface{}) {
  // 情况1
    read, _ := m.read.Load().(readOnly)
    if e, ok := read.m[key]; ok && e.tryStore(&value) {
        return
    }

    m.mu.Lock()
    read, _ = m.read.Load().(readOnly)
    if e, ok := read.m[key]; ok {
        if e.unexpungeLocked() {//情况2
            // The entry was previously expunged, which implies that there is a
            // non-nil dirty map and this entry is not in it.
            m.dirty[key] = e
        }
        e.storeLocked(&value) // 情况3  e.unexpungeLocked()为false的情况
    } else if e, ok := m.dirty[key]; ok {//情况4
        e.storeLocked(&value)
    } else {//情况5
        if !read.amended {
            // We're adding the first new key to the dirty map.
            // Make sure it is allocated and mark the read-only map as incomplete.
            m.dirtyLocked()
            m.read.Store(readOnly{m: read.m, amended: true})
        }
        m.dirty[key] = newEntry(value)
    }
    m.mu.Unlock()
}

源码面前无秘密,Store()操作大概会存在5种情况:

  1. 如果key已经在read map存在了 且dirty map中未被删除

通过调用e.tryStore(&value)直接无锁情况下,更新对应值。前提是对应值 非expunged

func (e *entry) tryStore(i *interface{}) bool {
    for {
        p := atomic.LoadPointer(&e.p)
        if p == expunged { //表示dirty map已删除对应值 返回false 让其更新完dirty map 再更新read map
            return false
        }
        if atomic.CompareAndSwapPointer(&e.p, p, unsafe.Pointer(i)) {// 直接更新值
            return true
        }
    }
}
  1. 如果key存在于read map,不在dirty map

先将key-value放到dirty map中,然后直接更新value,因为read mapdirty map持有的是相同的引用 故而一改全改

  1. 如果key同时存在于read mapdirty map

这个情况跟情况一类似,这个逻辑的原因是我们加锁过程中可能数据已经被加回dirty map,则直接更新read map的值即可 原因见情况2

  1. 如果key不在read map但存在于dirty map

这种情况直接更新即可,因为已经拿到锁了 所以是协程安全的

  1. 如果key不在read map也不存在于dirty map

首先判断read.amended若为false 则表明dirty map刚刚晋升为read map,此时dirty map为nil。然后调用m.dirtyLocked()

func (m *Map) dirtyLocked() {
    if m.dirty != nil { //不为nil 直接返回
        return
    }

    read, _ := m.read.Load().(readOnly)
    m.dirty = make(map[interface{}]*entry, len(read.m))
    for k, e := range read.m {
        if !e.tryExpungeLocked() { //删除则跳过复制
            m.dirty[k] = e //从read map拷贝一份数据引用给到dirty map
        }
    }
}
// 判断read map中的数据是否为nil 若是 则将其更新为expunged
// 同时数据也不会copy到dirty map,所以expunged表明数据已经从dirty map移除了
func (e *entry) tryExpungeLocked() (isExpunged bool) {
    p := atomic.LoadPointer(&e.p)
    for p == nil {
        if atomic.CompareAndSwapPointer(&e.p, nil, expunged) {
            return true
        }
        p = atomic.LoadPointer(&e.p)
    }
    return p == expunged
}

read map中的数据引用拷贝一份后,针对新来的数据 m.dirty[key] = newEntry(value)新建并插入

LoadOrStore操作

LoadOrStore顾名思义,如果值存在则直接返回,若不存在则存储,返回值loaded,true表示数据被加载,false表示数据被存储

func (m *Map) LoadOrStore(key, value interface{}) (actual interface{}, loaded bool) {
    // Avoid locking if it's a clean hit.
    read, _ := m.read.Load().(readOnly)
    if e, ok := read.m[key]; ok {
        actual, loaded, ok := e.tryLoadOrStore(value)
        if ok {
            return actual, loaded
        }
    }

    m.mu.Lock()
    read, _ = m.read.Load().(readOnly)
    if e, ok := read.m[key]; ok {
        if e.unexpungeLocked() {
            m.dirty[key] = e
        }
        actual, loaded, _ = e.tryLoadOrStore(value)
    } else if e, ok := m.dirty[key]; ok {
        actual, loaded, _ = e.tryLoadOrStore(value)
        m.missLocked()
    } else {
        if !read.amended {
            // We're adding the first new key to the dirty map.
            // Make sure it is allocated and mark the read-only map as incomplete.
            m.dirtyLocked()
            m.read.Store(readOnly{m: read.m, amended: true})
        }
        m.dirty[key] = newEntry(value)
        actual, loaded = value, false
    }
    m.mu.Unlock()

    return actual, loaded
}

大体逻辑跟Store差不了太多,我们主要关注下tryLoadOrStore

func (e *entry) tryLoadOrStore(i interface{}) (actual interface{}, loaded, ok bool) {
    p := atomic.LoadPointer(&e.p)
    if p == expunged {
        return nil, false, false
    }
    if p != nil {
        return *(*interface{})(p), true, true
    }

    // p==nil
    ic := i
    for {
        if atomic.CompareAndSwapPointer(&e.p, nil, unsafe.Pointer(&ic)) {
            return i, false, true
        }
        p = atomic.LoadPointer(&e.p)
        if p == expunged {//删除直接返回
            return nil, false, false
        }
        if p != nil { // 有值了 返回值
            return *(*interface{})(p), true, true
        }
    }
}

如果entry不是expunged 则自动加载或存储值, 如果entry为expunged 则直接返回 并且loaded和ok为false

Range操作

Range()要求一个函数f func(key, value interface{}) bool作为入参,将map中的key-value依次调用这个函数。如果函数返回false,则Range停止迭代。需要注意的是:Range使用的快照,并发插入的情况下不一定准确。

func (m *Map) Range(f func(key, value interface{}) bool) {
    read, _ := m.read.Load().(readOnly)
    if read.amended {//如果dirty map中存在read map中没有的值 则先晋升下
        m.mu.Lock()
        read, _ = m.read.Load().(readOnly)
        if read.amended {
            read = readOnly{m: m.dirty}
            m.read.Store(read)
            m.dirty = nil
            m.misses = 0
        }
        m.mu.Unlock()
    }
    //依次迭代
    for k, e := range read.m {
        v, ok := e.load()
        if !ok {
            continue
        }
        if !f(k, v) {
            break
        }
    }
}

逻辑比较简单:如果当前dirty map中存在read map中没有的值 则先将dirty map晋升为read map,然后再依次迭代调用传入的函数 ,返回false时中断。

Delete操作

删除指定key的value。

func (m *Map) Delete(key interface{}) {
    m.LoadAndDelete(key)
}

// 删除key对应的value 并返回之前的值 loaded表示key是否存在
func (m *Map) LoadAndDelete(key interface{}) (value interface{}, loaded bool) {
    read, _ := m.read.Load().(readOnly)
    e, ok := read.m[key]
    if !ok && read.amended {
        m.mu.Lock()
        read, _ = m.read.Load().(readOnly)
        e, ok = read.m[key]
        if !ok && read.amended {
            e, ok = m.dirty[key]
            delete(m.dirty, key)
      // 递增misses 找准时机晋升dirty map
            m.missLocked()
        }
        m.mu.Unlock()
    }
    if ok {
        return e.delete()
    }
    return nil, false//key不存在
}

删除分3中情况:

  1. key存在于read map则直接调用e.delete()将其置为nil 为了减少锁的开销提供并发性能,使用了个小技巧延迟删除

即这种情况下并没有直接物理删除,而是通过CAS将entry.p指针置为nil。

  1. key不在read map但存在于dirty map,则直接调用内建delete方法从map中删除元素
  2. key都不存在 直接返回

至此,全部操作都解析完毕,你可能对entry延迟删除的状态有点儿懵 没关系 上图

entry p status

expunged算是一个标记,表示dirty map中对应的值已经被干掉了。

需要注意的是 最好不要用占用内存比较大的类型作为key,因为sync.Map软删除并不会立刻将key-value删除掉,只是value置为了nil,所以大key有内存泄露的危险。
但是话说回来 应该没人这么干吧?

我看还有人专门讨论了一下(https://github.com/golang/go/issues/40999) 可以围观下

总结

整个源码看下来,不难发现,对于高频读写少的情况下,sync.Map基本时无锁情况下完成。但是对于写操作比较频繁的情况下,如果read map中拿不到数据,就会降级为加锁获取,然后misses增长变化速度势必比较快,连锁反应dirty map晋升为read map的操作也会比较频繁,其性能也势必会下降。所以写频繁的场景下sync.Map还是不太够看。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,047评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,807评论 3 386
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,501评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,839评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,951评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,117评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,188评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,929评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,372评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,679评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,837评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,536评论 4 335
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,168评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,886评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,129评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,665评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,739评论 2 351

推荐阅读更多精彩内容

  • sync.Cond实现了一个条件变量,用于等待一个或一组goroutines满足条件后唤醒的场景。每个Cond关联...
    光华路程序猿阅读 3,055评论 4 2
  • 本文从上下文Context、同步原语与锁、Channel、调度器四个方面介绍Go语言是如何实现并发的。本文绝大部分...
    彦帧阅读 1,559评论 1 3
  • Select select 可见监听 Channel 上的数据流动; select 结构与 switch 的结构类...
    hellomyshadow阅读 201评论 0 0
  • 转载自:https://halfrost.com/go_map_chapter_one/ https://half...
    HuJay阅读 6,132评论 1 5
  • 推荐指数: 6.0 书籍主旨关键词:特权、焦点、注意力、语言联想、情景联想 观点: 1.统计学现在叫数据分析,社会...
    Jenaral阅读 5,706评论 0 5