[C++ Primer Note10] 关联容器

关联容器和顺序容器的本质区别在于：关联容器中的元素是按关键字来保存和访问的，而顺序容器是按它们在容器中的位置来顺序保存和访问的。

标准库提供8个关联容器

按关键字有序保存元素：

map
set
multimap
multiset

无序集合：

unordered_map
unordered_set
unordered_multimap
unordered_multiset

其中，multi表示允许重复关键字。map和multimap定义在头文件map中；set和multiset定义在set中；无需容器定义在头文件unordered_map和unordered_set中。

一个经典的使用关联容器的例子是单词计数程序：

map<string,int> word_count;
string tmp;
while(cin>>tmp){
    ++word_count[tmp];
}

for(const auto &w:word_count){
    cout<<w.first<<":"<<w.second<<endl;
}

一旦读取完所有输入，范围for语句就会遍历map，当从map中提取一个元素时，会得到一个pair类型的对象，它是一个模板类型，保存两个名为first和second的公有数据成员，前者为key，后者为value。

上一个程序的一个合理拓展是：忽略常见单词，我们可以使用set保存想忽略的单词，只对不在集合中的单词统计出现次数：

map<string,int> word_count;
set<string> exclude={"The","But","And"};
string tmp;
while(cin>>tmp){
    if(exclude.find(tmp)==exclude.end())
        ++word_count[tmp];
}

set的find成员返回一个迭代器。如果给定关键字在set中，迭代器指向该关键字。否则，find返回尾后迭代器。

对于有序容器，关键字类型必须定义元素比较的方法，默认情况下，标准库使用关键字类型的<运算符来比较两个关键字。当然也可以自定义比较规则：

multiset<Sales_data,decltype(compareIsbn)*> bookstore(compareIsbn);

需要提供比较操作类型（一种函数指针类型），以及在构造函数中传入比较函数

pair标准库类型，定义在头文件utility中，一个pair保存两个数据成员。pair的默认构造函数对数据成员进行值初始化，我们可以这样初始化pair：

pair<string,string> author{"james","kevin"};
pair<int,string> student(1,"kevin");

关联容器额外定义了几个类型别名：

key_type：关键字类型
mapped_type：每个关键字关联的类型
value_type：对于set，就是key_type；对于map，是pair类型

当解引用一个关联容器迭代器时，我们会得到一个类型为容器的value_type的值得引用。
set的迭代器是const的，无论是iterator还是const_iterator。而map的pair中的第一个成员也是const的。
map和set类型都支持前述的begin和end操作，对于有序关联容器来说，按照关键字升序遍历。
我们通常不对关联容器使用泛型算法，关键字是const这一特性意味着不能将关联容器传递给修改或重排容器元素的算法。对于搜索算法而言，泛型算法是顺序搜索，而关联容器内部定义的find成员根据关键字搜索会快得多。
一般来说，仅在把关联容器当作源序列或者目的位置的时候才使用泛型算法。
添加元素：

添加元素

// 插入一个元素到map中
word_count.insert({word,1});
word_count.insert(make_pair(word,1));
word_count.insert(pair<string,size_t>(word,1));
word_count.insert(map<string,size_t>::value_type(word,1));

insert（或emplace）返回值依赖于容器类型和参数，对于不包含重复关键字的容器，添加单一元素的insert和emplace返回一个pair，first成员是一个指向给定关键字的迭代器(即使插入失败），second成员是一个bool，如果插入之前key已经存在返回false，否则插入成功返回true。对于允许重复关键字的容器，insert操作仅仅返回一个指向新元素的迭代器，没有bool值。
删除元素：

删除元素
map的下标操作：

下标操作

我们不能对multi版本的map进行下标操作，因为可能有多个值相关联。
下标运算符在关键字不存在的情况下会创建元素并插入到map。
与迭代器不同，map的下标操作返回的是mapped_type而不是解引用迭代器得到的value_type。
查找元素：

查找元素

我们可以通过lower_bound和upper_bound找到一个关键字相同的序列（对于multi来说）
新标准定义了4个无序关联容器，这些容器不是使用比较运算符（树）来组织元素，而是使用哈希函数和关键字类型的==运算符。在关键字类型的元素没有明显的序关系的情况下，无序容器非常有用。
无序容器无非就是一组桶，除了提供与有序容器相同的操作之外，它还提供了一组管理桶的成员函数，这些成员函数允许我们查询容器的状态以及在必要时强制容器进行重组：

无序容器管理操作
默认情况下，无序容器使用关键字类型的==运算符来比较元素，它们还使用一个hash<key_type>类型的对象来生成每个元素的哈希值。标准库为内置类型（包括指针）提供了hash模板。还为一些标准库类型，包括string和智能指针类型定义了hash。因此，我们可以直接定义关键字是内置类型，string以及智能指针的无序容器。
但是，我们不能直接定义关键字类型为自定义类型的无序容器，与容器不同，不能直接使用哈希模板，而必须提供我们自己的hash模板版本。但我们可以使用类似于为有序容器重载关键字类型的方法提供函数代替==运算符和哈希值计算函数去实现同样的效果。

[C++ Primer Note10] 关联容器

[C++ Primer Note10] 关联容器

相关阅读更多精彩内容

友情链接更多精彩内容