【c++丨STL】set/multiset的使用

简介: 本文深入解析了STL中的`set`和`multiset`容器,二者均为关联式容器,底层基于红黑树实现。`set`支持唯一性元素存储并自动排序,适用于高效查找场景;`multiset`允许重复元素。两者均具备O(logN)的插入、删除与查找复杂度。文章详细介绍了构造函数、迭代器、容量接口、增删操作(如`insert`、`erase`)、查找统计(如`find`、`count`)及`multiset`特有的区间操作(如`lower_bound`、`upper_bound`、`equal_range`)。最后预告了`map`容器的学习,其作为键值对存储的关联式容器,同样基于红黑树,具有高效操作特性。

前言

之前,我们已经探索了STL中的多个容器及容器适配器,如string、vector、list,以及stack和priority_queue等。今天,我们将进一步拓宽视野,深入学习STL中的容器——set及其变种multiset

作为STL的重要组成部分,set以其独特的性质——元素自动排序且不重复,在解决许多实际问题时发挥着不可替代的作用。无论是处理需要唯一性的数据集合,还是实现高效的查找操作,set都以其简洁的接口和强大的功能赢得了开发者们的青睐。

一、序列式容器和关联式容器

之前我们学习的string、vector、list等容器都是序列式容器, 它们的逻辑结构都是线性序列。对于序列式容器,它们的元素之间通常没有相关性,其元素按照逻辑顺序进行存储和访问

而set和multiset是关联式容器,它虽然也可以存储数据,但与序列式容器不同的是,其逻辑结构通常是非线性的元素之间存在紧密联系,元素按照关键字进行存储和访问。如果擅自修改某个元素或者移动元素的逻辑位置,就会破坏它的存储结构。

二、set和multiset简介

image.png

image.png

set(集合)multiset(多重集合)是STL中的容器,分别用于处理唯一元素和允许重复元素的场景,它们的底层结构都是红黑树(一种自平衡二叉搜索树)

set和multiset有以下共同特点:

1. 容器元素自动按照升序排列(也可通过传入第二个模板参数调整排序规则)。

2. 元素插入、删除、查找的时间复杂度均为O(logN)

set和multiset的核心区别是:set不允许容器内有重复元素,能够达到去重的效果;而multiset支持插入重复元素。

鉴于set和multiset的接口功能几乎没有区别,且set更为常用所以**接下来的内容将主要聚焦于set常用接口的使用方法**。当然,我们也会在适当的时候提及multiset,以便大家能够对比两者的异同,从而更好地根据实际需求做出选择。

我们在使用 set 或 multiset 时,需要引头文件,并且该容器定义在命名空间std当中。

set和multiset相关接口查阅:

三、set的默认成员函数

set显式实现的默认成员函数有三个:
image.png

构造函数(constructor)

image.png

c++14下,set有五种,其中较为常用的有以下四个:

函数原型 功能说明
set(); 无参构造
set(InputIterator first, InputIterator last); 迭代器区间构造
set(const set& x); 拷贝构造,用一个set对象构造另一个set对象
set(initializer_list il); 初始化器构造

代码示例:

#include <iostream>
#include <set>
using namespace std;

template<class T>
void print(const T& con)
{
   
    for (const auto& e : con)
    {
   
        cout << e << ' ';
    }
    cout << endl;
}

int main()
{
   
    set<int> s1;
    set<int> s2({
    6,0,2,8,4 });
    set<int> s3(s2);
    set<int> s4(s2.begin(), s2.end());
    cout << "s1:";
    print(s1);
    cout << "s2:";
    print(s2);
    cout << "s3:";
    print(s3);
    cout << "s4:";
    print(s4);
    return 0;
}

image.png

析构函数

image.png

析构函数帮助我们自动释放容器动态申请的空间。

赋值重载

image.png

将新内容分配给已经存在的容器,替换其当前内容。

代码示例:

#include <iostream>
#include <set>
using namespace std;

int main()
{
   
    set<int> s1({
    4,8,2 });
    set<int> s2;
    s2 = s1;
    for (auto& e : s2)
    {
   
        cout << e << ' ';
    }
    cout << endl;
    return 0;
}

image.png

四、set的迭代器接口

image.png

与vector、list等容器相同,set也支持使用迭代器进行元素访问和遍历。

这里有三点需要注意:

1. set的迭代器是**双向迭代器**。

2. set迭代器进行顺序遍历的结果是**有序的,这归因于它采用了红黑树的中序遍历**算法。

3. 无论是使用普通迭代器还是const迭代器,都**无法修改set元素的值。(set元素的值不支持修改**)

set迭代器的使用方法与其他容器没什么区别,这里就不再赘述。

五、set的容量接口

image.png

empty

image.png

判断set容器是否为空。若为空,则返回true;否则返回false。

该函数不会以任何方式修改容器。

代码示例:

#include <iostream>
#include <set>
using namespace std;

int main()
{
   
    set<int> s1;
    set<int> s2({
    1,2,3 });
    cout << s1.empty() << endl;
    cout << s2.empty() << endl;
    return 0;
}

image.png

size

image.png

返回set容器当中的元素个数。

代码示例:

#include <iostream>
#include <set>
using namespace std;

int main()
{
   
    set<int> s1;
    set<int> s2({
    1,2,3 });
    cout << s1.size() << endl;
    cout << s2.size() << endl;
    return 0;
}

image.png

六、set的增删相关接口

image.png

insert

image.png

insert的功能是插入元素支持单个值插入、指定位置插入(实际未必插入在指定位置,因为要保持有序性)、迭代器区间插入和初始化器插入

注意:单个值插入函数的返回值是一个pair(二元组,之前的文章已经提到过),其具体内容如下:

当容器中没有相同值元素,则插入成功,返回值pair的第一个元素是指向新插入元素的迭代器,第二个元素是布尔类型,值为true;反之,当容器中已有相同值的元素,则意味着插入失败,返回值pair的第一个元素是指向已有元素的迭代器,第二个元素的值为false

对于multiset而言,由于其允许相同元素存在,所以单个值插入接口的返回值是一个指向新插入元素的迭代器

代码示例:

#include <iostream>
#include <set>
using namespace std;

template<class T>
void print(const T& con)
{
   
    for (const auto& e : con)
    {
   
        cout << e << ' ';
    }
    cout << endl;
}

int main()
{
   
    set<int> s1({
    1,2,3 });
    multiset<int> s2({
    1,2,3 });
    auto a = s1.insert(1);
    auto b = s2.insert(1);
    cout << "s1.insert(1):" << a.second << endl;
    cout << "s2.insert(1):" << *b << endl;
    cout << endl;
    cout << "s1:";
    print(s1);
    cout << "s2:";
    print(s2);
    return 0;
}

image.png

erase

image.png

erase的功能是删除set容器内的元素, 它支持按值删除,迭代器删除和迭代器区间删除。对于按值删除,函数的返回值是成功删除的元素个数,其他两个函数的返回值是指向被删除元素(或区间)下一个元素的迭代器

对于multiset,如果有多个val值,则该函数会删除所有的val,并返回下一个元素的迭代器。

代码示例:

#include <iostream>
#include <set>
using namespace std;

template<class T>
void print(const T& con)
{
   
    for (const auto& e : con)
    {
   
        cout << e << ' ';
    }
    cout << endl;
}

int main()
{
   
    set<int> s = {
    1,2,3,4,5,6,7,8,9,10 };
    cout << "s: ";
    print(s);
    cout << endl;
    cout << "迭代器删除" << endl;
    s.erase(s.begin());
    cout << "s: ";
    print(s);
    cout << endl;
    cout << "按值删除" << endl;
    cout << "被删除的元素个数:" << s.erase(1) << endl;
    cout << "s: ";
    print(s);
    cout << endl;
    cout << "被删除的元素个数:" << s.erase(2) << endl;
    cout << "s: ";
    print(s);
    cout << endl;
    cout << "迭代器区间删除" << endl;
    s.erase(s.begin(), s.end());
    cout << "s: ";
    print(s);
    return 0;
}

image.png

swap

image.png

交换两个set容器的内容。两个容器大小可能不同。

在调用成员函数之后,所有迭代器、引用和指针对交换后的对象仍然有效。

请注意,存在一个名称相同的非成员函数swap,它用与该成员函数类似的优化重载了该算法。

代码示例:

#include <iostream>
#include <set>
using namespace std;

template<class T>
void print(const T& con)
{
   
    for (const auto& e : con)
    {
   
        cout << e << ' ';
    }
    cout << endl;
}

int main()
{
   
    set<int> s1 = {
    1,2,3 };
    set<int> s2 = {
    4,5,6 };
    cout << "s1: ";
    print(s1);
    cout << "s2: ";
    print(s2);
    s1.swap(s2);
    cout << endl << "交换后:" << endl;
    cout << "s1: ";
    print(s1);
    cout << "s2: ";
    print(s2);
    return 0;
}

image.png

clear

image.png

从set容器中删除所有元素,容器的大小变为0。

七、set的其他操作接口

image.png

find

image.png

find的功能是查找(按值查找)。在容器中搜索与val等效的元素,如果找到则返回指向查找到的元素迭代器,否则返回尾迭代器

对于multiset,如果找到的元素在容器中有重复值,则函数返回中序遍历序列第一个找到的元素的迭代器。

代码示例:

#include <iostream>
#include <set>
using namespace std;

int main()
{
   
    set<int> s = {
    1,2,3,4,5 };
    int num = 0;
    while (cin >> num)
    {
   
        if (s.find(num) != s.end())
        {
   
            cout << "找到了!\n" << endl;
        }
        else
        {
   
            cout << "没找到\n" << endl;
        }
    }
    return 0;
}

image.png

count

image.png

count返回容器中值为val的元素个数
因为set容器中的所有元素都是唯一的,所以该函数只能返回1或0,因此可以判断一个元素是否在set容器中但对于允许出现重复元素的multiset,它还可以用于统计某元素的个数

代码示例:

#include <iostream>
#include <set>
using namespace std;

int main()
{
   
    set<int> s = {
    1,2,3 };
    multiset<int> ms = {
    1,2,2,2,3 };
    cout << s.count(2) << endl;
    cout << ms.count(2) << endl;
    return 0;
}

image.png

接下来要介绍的 lower_bound** upper_bound equal_range multiset常用接口。**

lower_bound和upper_bound

image.png

返回一个迭代器,指向容器中第一个不在val值之前的元素(查找区间左端点)。

也就是说当容器内部有形如{val, val, val,...}的子序列时,返回第一个val的迭代器

如果val应位于所有元素之前,则函数返回当前第一个元素的迭代器。

反之,若val应位于所有元素之后,则函数返回尾迭代器。

image.png

upper_bount函数返回一个迭代器,指向容器中被认为是val之后的第一个元素(查找区间右端点)。至于为什么不返回第一个不在val值之后的元素,是因为STL的区间都遵循“左闭右开”

也就是说当容器内部有形如{val, val, val,...}的子序列时,返回最后一个val的下个元素的迭代器

如果val应位于所有元素之前,则函数返回当前第一个元素的迭代器。

反之,如果val应位于所有元素之后,则函数返回尾迭代器。

代码示例:

#include <iostream>
#include <set>
using namespace std;

int main()
{
   
    multiset<int> ms = {
    1,2,2,2,3 };
    auto begin = ms.lower_bound(2);
    auto end = ms.upper_bound(2);
    for (auto it = begin; it != end; it++)
    {
   
        cout << *it << ' ';
    }
    cout << endl;
    return 0;
}

image.png

equal_range

image.png

返回一个pair(两个迭代器),表示范围的边界(**注意左闭右开**),该范围包含容器中与val相等的所有元素

如果val应位于所有元素之前,则返回的两个迭代器都指向第一个元素。

反之,如果val应位于所有元素之后,则返回的两个迭代器都是尾迭代器。

代码示例:

#include <iostream>
#include <set>
using namespace std;

int main()
{
   
    multiset<int> ms = {
    1,2,2,2,3 };
    auto range = ms.equal_range(2);
    for (auto it = range.first; it != range.second; it++)
    {
   
        cout << *it << ' ';
    }
    cout << endl;
}

image.png

总结

通过本文的学习,我们深入了解了STL中的set容器及其变种multiset。set以其元素自动排序且不重复的特性,在需要唯一性数据集合和高效查找操作的场景中发挥着重要作用。

在了解set容器的基础上,之后我们会进一步引出STL中的另一个重要容器——map。与set类似,map也是关联式容器,其底层结构同样可以采用红黑树。不同的是,map存储的是键值对(key_value),且键(key)是唯一的,而值(value)可以是任意的。map容器以键为基准进行自动排序,并支持高效的查找、插入和删除操作。如果你觉得博主讲的还不错,就请留下一个小小的赞在走哦,感谢大家的支持❤❤❤

相关文章
|
2月前
|
缓存 算法 程序员
C++STL底层原理:探秘标准模板库的内部机制
🌟蒋星熠Jaxonic带你深入STL底层:从容器内存管理到红黑树、哈希表,剖析迭代器、算法与分配器核心机制,揭秘C++标准库的高效设计哲学与性能优化实践。
C++STL底层原理:探秘标准模板库的内部机制
|
9月前
|
编译器 C++ 容器
【c++丨STL】基于红黑树模拟实现set和map(附源码)
本文基于红黑树的实现,模拟了STL中的`set`和`map`容器。通过封装同一棵红黑树并进行适配修改,实现了两种容器的功能。主要步骤包括:1) 修改红黑树节点结构以支持不同数据类型;2) 使用仿函数适配键值比较逻辑;3) 实现双向迭代器支持遍历操作;4) 封装`insert`、`find`等接口,并为`map`实现`operator[]`。最终,通过测试代码验证了功能的正确性。此实现减少了代码冗余,展示了模板与仿函数的强大灵活性。
277 2
|
9月前
|
存储 算法 C++
【c++丨STL】map/multimap的使用
本文详细介绍了STL关联式容器中的`map`和`multimap`的使用方法。`map`基于红黑树实现,内部元素按键自动升序排列,存储键值对,支持通过键访问或修改值;而`multimap`允许存在重复键。文章从构造函数、迭代器、容量接口、元素访问接口、增删操作到其他操作接口全面解析了`map`的功能,并通过实例演示了如何用`map`统计字符串数组中各元素的出现次数。最后对比了`map`与`set`的区别,强调了`map`在处理键值关系时的优势。
518 73
|
6月前
|
存储 编译器 容器
set、map、multiset、multimap的介绍及使用以及区别,注意事项
set是按照一定次序存储元素的容器,使用set的迭代器遍历set中的元素,可以得到有序序列。set当中存储元素的value都是唯一的,不可以重复,因此可以使用set进行去重。set默认是升序的,但是其内部默认不是按照大于比较,而是按照小于比较。set中的元素不能被修改,因为set在底层是用二叉搜索树来实现的,若是对二叉搜索树当中某个结点的值进行了修改,那么这棵树将不再是二叉搜索树。
260 0
|
2月前
|
存储 JavaScript Java
(Python基础)新时代语言!一起学习Python吧!(四):dict字典和set类型;切片类型、列表生成式;map和reduce迭代器;filter过滤函数、sorted排序函数;lambda函数
dict字典 Python内置了字典:dict的支持,dict全称dictionary,在其他语言中也称为map,使用键-值(key-value)存储,具有极快的查找速度。 我们可以通过声明JS对象一样的方式声明dict
232 1
|
5月前
|
存储 缓存 JavaScript
Set和Map有什么区别?
Set和Map有什么区别?
465 1
|
2月前
|
存储 算法 容器
set_map的实现+set/map加持秒杀高频算法题锻炼算法思维
`set`基于红黑树实现,支持有序存储、自动去重,增删查效率为O(logN)。通过仿函数可自定义排序规则,配合空间配置器灵活管理内存。不支持修改元素值,迭代器失效需注意。`multiset`允许重复元素。常用于去重、排序及查找场景。
|
6月前
|
存储 JavaScript 前端开发
for...of循环在遍历Set和Map时的注意事项有哪些?
for...of循环在遍历Set和Map时的注意事项有哪些?
343 121
|
6月前
|
存储 C++ 容器
unordered_set、unordered_multiset、unordered_map、unordered_multimap的介绍及使用
unordered_set是不按特定顺序存储键值的关联式容器,其允许通过键值快速的索引到对应的元素。在unordered_set中,元素的值同时也是唯一地标识它的key。在内部,unordered_set中的元素没有按照任何特定的顺序排序,为了能在常数范围内找到指定的key,unordered_set将相同哈希值的键值放在相同的桶中。unordered_set容器通过key访问单个元素要比set快,但它通常在遍历元素子集的范围迭代方面效率较低。它的迭代器至少是前向迭代器。前向迭代器的特性。
302 0