C++set源码分析以及c11新特性unordered_set

首先先看一下set的模板定义
template < class T,                        // set::key_type/value_type
           class Compare = less<T>,        // set::key_compare/value_compare
           class Alloc = allocator<T>      // set::allocator_type
           > class set;

在理解这个定义之前,先了解一下什么是仿函数
仿函数实际上就是拥有函数性质的对象,用法与函数类似,但是其实它是一个类。
它是一个拥有函数功能的对象,必须在类中实现operator(),这个类就有了类似函数的功能。

那么为什么要有仿函数,我们直接用函数不就行了?

因为仿函数是对象!它有记录功能!
下面来看一下仿函数记录功能的应用:
假设有一个vector<string>,你的任务是统计长度小于n的string的个数,如果使用count_if函数的话,你的代码可能长成这样:

 bool LenthIsLessThan(const string& str, int len) {
     return str.length()<len;
 }
 int res=count_if(vec.begin(), vec.end(), LengthIsLessThanFive);
//但是我们的count_if要求函数参数为1,这样使用就不合法

那么根据我们的伪函数的概念,有记录功能,那么我们可以在伪函数内设置一个成员变量用存储长度,如下:

 class ShorterThan {
     public:
         explicit ShorterThan(int maxLength) : length(maxLength) {}
         bool operator() (const string& str) const {
             return str.length() < length;
         }
     private:
         const int length;
 };
 count_if(myVector.begin(), myVector.end(), ShorterThan(length));//直接调用即可
明白了仿函数的概念,那么我们再来看一下set定义
template < class T,                        // set::key_type/value_type
           class Compare = less<T>,        // set::key_compare/value_compare
           class Alloc = allocator<T>      // set::allocator_type
           > class set;

第二个参数less<T>也应用了伪函数的概念,我们可以看一看它的源码,也是重写了operator(),继承了binary_function,这个基类可以用来创建具有两个参数的函数对象

template<class _Ty = void>
    struct less
        : public binary_function<_Ty, _Ty, bool>
    {   // functor for operator<
    bool operator()(const _Ty& _Left, const _Ty& _Right) const
        {   // apply operator< to operands
        return (_Left < _Right);
        }
    };

所以set的排序是通过它的第二个参数进行的,如果要自定义排序行为,可以传入第二个参数,但是默认是使用less


查看set的文档注意到:

The value of the elements in a set cannot be modified once in the container (the elements are always const), but they can be inserted or removed from the container.

意思就是说在set容器里,我们不能改变里面的值,因为所有的值都是const,但是我们可以插入或者删除这些值
排序的底层框架也是遵循红黑树,前面已经提过红黑树了,就不多说。


unordered_set

底层实现与set的区别

set底层实现是红黑树,而unordered_set的底层是hashtable

什么是hash table?

是根据关键字key直接访问在内存存储位置的数据结构,它是通过一个关键值的函数将所需数据映射到表中的位置来访问数据,这种映射函数叫做"散列函数",存放记录的数组叫做"散列表"

如何构造hash table?

1.直接定址法:取关键字的某个线性函数为散列地址
即:直接以关键字k或者k加上某个常数(k+c)作为哈希地址,即:h(k) = k + c
坏处:关键字不连续会浪费大量存储空间。
2.除留余数法:取关键值被某个不大于散列表的数p除后的余数作为散列地址(因为留余可能相等,所以这里会发生哈希冲突),对于p得慎重选择,使得元素集合中每一个关键字通过散列函数转换后映射到哈希表的任意地址上的概率相等。


如何解决哈希冲突?

开放定址法

什么是开放定址法?

哈希表中的空闲单元(即为a)既可以被哈希地址为a的关键字使用,也可以被发生冲突的其他关键字使用。谁先找到这个单元谁先占用。

下面介绍几种开放定址
  • 线性探测法:在hash之后,当发现该地址已经存在数据,就放到下一个地址,如果下一个地址也冲突,就继续往下,直到找到没有冲突的位置存下。
  • 平方探测(二次探测):与上面的类似,也是发现地址存在数据,但是此时不是放到下一个位置,而是放到该位置的平方的位置。
  • 链地址法:如果哈希表空间为0~m-1,设置一个由m个指针分量组成的一维数组ST[m],凡哈希地址为i的元素都插入到头指针为ST[i]的链表中。(也就是数组+链表结构)
    链地址法

unordered_set也是通过链地址法来解决冲突的。
来看一下unordered_set的定义

template < class Key,  
    class Hash = hash<Key>,  
    class Pred = equal_to<Key>,  
    class Alloc = allocator<Key>  
> class unordered_set; 
  • hash<Key>通过相应的哈希函数,将传入的参数转换为一个size_t类型值,然后使用该值对当前的hashtable的桶取模算出对应的hash值。

    c++标准库已经提供了基本数据类型的hash函数,但是这里需要注意一点,对于指针,标准库只是将指针的地址转换成一个size_t类型的值作为hash值。如果要使用char *所指向的内容做hash,那么需要自己写hash函数或者调用系统提供的hash<string>
    c11为字符串提供了murmur hash这个hash函数(该函数通过不断的乘法旋转减少碰撞率),murmur hash后被google改动为cityhash
    当然,我们在使用unordered_set可以传入我们自己写的hash函数

  • equal_to<Key>
    equal_to也是我们前面提到的伪函数

template<class _Ty = void>
    struct equal_to
        : public binary_function<_Ty, _Ty, bool>
    {   // functor for operator==
    bool operator()(const _Ty& _Left, const _Ty& _Right) const
        {   // apply operator== to operands
        return (_Left == _Right);
        }
    };
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,686评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,668评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,160评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,736评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,847评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,043评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,129评论 3 410
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,872评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,318评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,645评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,777评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,470评论 4 333
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,126评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,861评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,095评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,589评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,687评论 2 351

推荐阅读更多精彩内容