位图

嵌牛导读:位图的引出,主要还是在于当我们想做一个很大的set的时候,位图可以帮助我们节省非常大的空间。

嵌牛鼻子:位图

嵌牛提问:处理算法复杂度过高,如何降低算法复杂度呢?

嵌牛正文:

比如说:我们有1千万个整数,整数的范围在1到1亿之间。如何快速查找某个整数是否在1千万个整数中呢?

非常简单的话,我们可以用一个桶来做。但是会浪费90%的空间。即做一个1亿大小的bool数组,哪个数存在,哪个置为true。需要100M空间

用一个散列表。假设散列函数非常完美,有50%的占有率的一个hashset。我们需要2千万 * 4 = 80M大小的空间。但是这里的散列函数是有一点计算复杂度的。

引出

而我们的位图就是用的第一种思想,但是,我们用一个字节来表示俩个状态,true和false太过浪费,我们就只用1个bit来表示。

所以就只需要100M / 8 = 20 大概不到20M左右的空间。

小坑

我们的想法是非常好的,但是要怎么操作呢?大部分语言中让我们可以操纵的最小计算机单位是1个字节。即我们是没办法直接去操纵一个位的。因此我们就需要一个映射。

Add

原来的想法

如果我们想要表示1个数字已经存在,比如x。我们直接就是

vector<bool> charVec;

charVec[x] = true;

这样就可以了。

上面的想法实际上就是置第x+1个bool值为true,位图的想法就是去置第x+1个bit值为1

但是大部分语言提供的最小的可操作单位就是一个字节。因此我们就需要做一个简单的映射

int index = x / 8

int bit = x % 8

charVec[index] |= 1 << bit

// 或者

vector<int16t> int16Vec

int index = x / 16

int bit = x % 16

int16Vec[index] |= 1 << bit

// 或者

vector<int32t> int32Vec

int index = x / 32

int bit = x % 32

int32Vec[index] |= 1 << bit

我觉得上面的代码已经讲得非常清楚了,用语言表示反而比较苍白无力。

比如说我们想要Add(100),我们就需要在第101个bit上置1。(我们的第一个bit置1表示0,这个可以自己修改),然后我们就要算出第101个bit首先在第多少个字节上。其在第index个字节上。然后再算出其在第多少个bit上。其在第bit+1个bit上。大概就是这样的一个数学关系,举几个例子就很好理清楚。

Has

如何判断一个数是否在我们在set中呢?

int index = x / 8

int bit = x % 8

if( charVec[index] & (1 << bit) )

    return true

备注:以上是大概类似c++形式的伪代码。仅仅做了俩个方法,C++11是新出了bitset的数据结构供我们使用的。非常方便。我自己就不重复造轮子了。下面是《Go语言圣经》中的部分源码,注意其底层结构时动态增长的。

go源码

type IntSet struct {

words []uint64

}

func (s *IntSet) Has(x int) bool {

index, bit := x/64, uint(x%64)

return index < len(s.words) && s.words[index]&(1<<bit) != 0

}

func (s *IntSet) Add(x int) {

index, bit := x/64, uint(x%64)

// 扩容,如果下标不够就需要扩容

for index >= len(s.words) {

s.words = append(s.words, 0)

}

s.words[index] |= (1 << bit)

}

// 合并俩个set

func (s *IntSet) UnionWith(t *IntSet) {

for i, tword := range t.words {

if i < len(s.words) {

s.words[i] |= tword

} else {

s.words = append(s.words, tword)

}

}

}

func (s *IntSet) String() string {

var buf bytes.Buffer

buf.WriteByte('{')

for i, word := range s.words {

if word == 0 {

continue

}

for j := 0; j < 64; j++ {

if word&(1<<uint(j)) != 0 {

if buf.Len() > len("{") {

buf.WriteByte(' ')

}

fmt.Fprintf(&buf, "%d", 64*i+j)

}

}

}

buf.WriteByte('}')

return buf.String()

}

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,185评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,445评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,684评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,564评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,681评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,874评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,025评论 3 408
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,761评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,217评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,545评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,694评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,351评论 4 332
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,988评论 3 315
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,778评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,007评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,427评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,580评论 2 349

推荐阅读更多精彩内容