之前用的比较多的是map,map的底层实现是红黑二叉树,map是key_value对,如果想将自定义的类型放到map中,需要在自定义类型中重载<操作符,这是因为map排序的需要(即树的节点转换)
而hash_map的底层实现是hash表,且为了解决hash碰撞,使用了开链(具体可参考侯捷的stl源码剖析)
目前使用std::hash_map需要先定义宏_SILENCE_STDEXT_HASH_DEPRECATION_WARNINGS,因为在hash_map的头文件中已经解释的很明白了
#ifndef _SILENCE_STDEXT_HASH_DEPRECATION_WARNINGS
#error <hash_map> is deprecated and will be REMOVED. Please use <unordered_map>. You can define \
_SILENCE_STDEXT_HASH_DEPRECATION_WARNINGS to acknowledge that you have received this warning.
#endif
按最简单的思路,自己写一个测试类,然后验证下hash_map,因为我使用的是std::hash_map,和sgi里面的hashmap有点不同,所以就写个简单类,缺啥补啥
class A {
public:
A(std::string str, int a) : str_(str), test_(a) {
}
std::string GetStr() const{ return str_; }
int GetInt() const{ return test_; }
private:
std::string str_;
int test_;
};
int main()
{
std::hash_map <A, std::string> hash_map_test;
A a("test1", 11);
A b("test2", 15);
hash_map_test[a] = "hello";
hash_map_test[b] = "hash_map";
错误 C2678 二进制“<”: 没有找到接受“const _Ty”类型的左操作数的运算符(或没有可接受的转换) ConsoleApplication2
看的出需要我们重载<操作符,OK,加上
bool operator <(const A& thr) const {
return test_ < thr.test_;
}
错误 C2440 “static_cast”: 无法从“const _Kty”转换为“size_t”
发现需要提供一种方法,实现从测试类型转换为size_t,查资料是需要我们重载hash_value函数,OK,添加下
friend size_t hash_value(const A& thr) {
return ((size_t)(thr.test_));
}
编译通过了,我使用的是vs2019 不太清楚其他的编译器是否一样,不过感觉大体应该差不多,不会有很大出入
此处是简单的用了int来做hash函数,是为了看看hash_map里面的桶,已经数据是否按照我们想的落到对应的桶里
std::hash_map <A, std::string> hash_map_test;
A a("test1", 11);
A b("test2", 15);
hash_map_test[a] = "hello";
hash_map_test[b] = "hash_map";
int ncount = hash_map_test.bucket_count();
for (int i = 0; i < ncount; i++) {
std::cout << "bucket: " << i << ", size is :" << hash_map_test.bucket_size(i) << std::endl;
for (auto it = hash_map_test.begin(i); it != hash_map_test.end(i); it++) {
std::cout << it->first.GetStr() << it->second << std::endl;
}
}
bucket: 0, size is :0
bucket: 1, size is :1
test2hash_map
bucket: 2, size is :0
bucket: 3, size is :0
bucket: 4, size is :0
bucket: 5, size is :1
test1hello
bucket: 6, size is :0
bucket: 7, size is :0
发现是8个桶,11和15差了四个桶,符合我们的预期(15%8 - 11%8 = 4)
可以看到,虽然我只插入了两个元素,但是是有8个桶,所以hash_map会有内存的浪费。
map和hash_map什么时候使用哪一个呢?具体的看数据量,数据量大,需要考虑查找速度时,考虑hash_map.对内存有要求,则尽量不要使用hash_map