hash_map

之前用的比较多的是map,map的底层实现是红黑二叉树,map是key_value对,如果想将自定义的类型放到map中,需要在自定义类型中重载<操作符,这是因为map排序的需要(即树的节点转换)
而hash_map的底层实现是hash表,且为了解决hash碰撞,使用了开链(具体可参考侯捷的stl源码剖析)
目前使用std::hash_map需要先定义宏_SILENCE_STDEXT_HASH_DEPRECATION_WARNINGS,因为在hash_map的头文件中已经解释的很明白了

#ifndef _SILENCE_STDEXT_HASH_DEPRECATION_WARNINGS
#error <hash_map> is deprecated and will be REMOVED. Please use <unordered_map>. You can define \
_SILENCE_STDEXT_HASH_DEPRECATION_WARNINGS to acknowledge that you have received this warning.
#endif

按最简单的思路,自己写一个测试类,然后验证下hash_map,因为我使用的是std::hash_map,和sgi里面的hashmap有点不同,所以就写个简单类,缺啥补啥

class A {
public:
    A(std::string str, int a) : str_(str), test_(a) {
    }
    std::string GetStr() const{ return str_; }
    int GetInt() const{ return test_; }
private:
    std::string str_;
    int test_;
};

int main()
{
    std::hash_map <A, std::string> hash_map_test;
    A a("test1", 11);
    A b("test2", 15);
    hash_map_test[a] = "hello";
    hash_map_test[b] = "hash_map";

错误  C2678   二进制“<”: 没有找到接受“const _Ty”类型的左操作数的运算符(或没有可接受的转换) ConsoleApplication2 

看的出需要我们重载<操作符,OK,加上

bool operator <(const A& thr) const {
        return test_ < thr.test_;
}

错误  C2440   “static_cast”: 无法从“const _Kty”转换为“size_t”   

发现需要提供一种方法,实现从测试类型转换为size_t,查资料是需要我们重载hash_value函数,OK,添加下

friend size_t hash_value(const A& thr) {
        return ((size_t)(thr.test_));
}

编译通过了,我使用的是vs2019 不太清楚其他的编译器是否一样,不过感觉大体应该差不多,不会有很大出入
此处是简单的用了int来做hash函数,是为了看看hash_map里面的桶,已经数据是否按照我们想的落到对应的桶里

    std::hash_map <A, std::string> hash_map_test;
    A a("test1", 11);
    A b("test2", 15);
    hash_map_test[a] = "hello";
    hash_map_test[b] = "hash_map";
    int ncount = hash_map_test.bucket_count();
    for (int i = 0; i < ncount; i++) {
        std::cout << "bucket: " << i << ", size is :" << hash_map_test.bucket_size(i) << std::endl;
        for (auto it = hash_map_test.begin(i); it != hash_map_test.end(i); it++) {
            std::cout << it->first.GetStr() << it->second << std::endl;
        }
    }

bucket: 0, size is :0
bucket: 1, size is :1
test2hash_map
bucket: 2, size is :0
bucket: 3, size is :0
bucket: 4, size is :0
bucket: 5, size is :1
test1hello
bucket: 6, size is :0
bucket: 7, size is :0

发现是8个桶,11和15差了四个桶,符合我们的预期(15%8 - 11%8 = 4)
可以看到,虽然我只插入了两个元素,但是是有8个桶,所以hash_map会有内存的浪费。
map和hash_map什么时候使用哪一个呢?具体的看数据量,数据量大,需要考虑查找速度时,考虑hash_map.对内存有要求,则尽量不要使用hash_map

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容