并查集

xiaoxiao2025-11-10 7

Problem Description 某省调查城镇交通状况，得到现有城镇道路统计表，表中列出了每条道路直接连通的城镇。省政府“畅通工程”的目标是使全省任何两个城镇间都可以实现交通（但不一定有直接的道路相连，只要互相间接通过道路可达即可）。问最少还需要建设多少条道路？ Input 测试输入包含若干测试用例。每个测试用例的第1行给出两个正整数，分别是城镇数目N ( < 1000 )和道路数目M；随后的M行对应M条道路，每行给出一对正整数，分别是该条道路直接连通的两个城镇的编号。为简单起见，城镇从1到N编号。注意:两个城市之间可以有多条道路相通,也就是说 3 3 1 2 1 2 2 1 这种输入也是合法的当N为0时，输入结束，该用例不被处理。 Output 对每个测试用例，在1行里输出最少还需要建设的道路数目。 Sample Input 4 2 1 3 4 3 3 3 1 2 1 3 2 3 5 2 1 2 3 5 999 0 0 Sample Output 1 0 2 998 Hint

Huge input, scanf is recommended.

畅通工程是并查集里面，非常基础且典型的一道题。

相互连接的城市构成一个集合，只需要判断集合个数即可知道要修多少条路。

集合个数的判断也可以根据每个集合只有一个根节点的特征，找n个数里有几个根节点，并减去1。

为什么减去1？ 3个孤独的城镇互联，只需要两条路，同理三个集合之间关联也只需要两条路，所以是集合总数减1。

再说一下并查集，并查集的概念用数来理解较好，但是实现是用数组来实现的。

就用上面这个图来简单说一下吧。

令a,b,c,d组成一个集合，e,f,g组成另一个集合。

谈到树的概念，树的维护用father数组，就是父节点，每一个树叶都有各自的父节点，最终会查询到这棵树的根节点，根节点是唯一的。例如：d的父节点是b，b的父节点是a，a是这棵树的根节点。

如何判断d和c有联系呢？

通过向上查找根节点，查看这两个点的根节点是否相同，即可知道它们两者是否有联系。

d的根节点是a，c的父节点是a，同样a也是父节点→可以发现d和c的根节点相同，所以可以判断他们之间属于一个集合，即有联系。

并查集，显然就是将集合合并起来。

合并的意义就是让两个集合之间都可以相关联，判断关联与否在于父节点是否相同。

因此，合并就是将一个树为主树（一般以节点个数多的为主），一个树扩展成主树的一条枝。

修改只需要修改从树根节点的father值，将从树根节点的父节点设置为主树根节点。

这样两个树就合并成一个树了。

同右面的图，判断d和g是否相关联：

d的根节点为a，g的父节点为f，f父节点e，e父节点为a，因为两者根节点相同，所以这两者是相关联的。

这些都是我的理解，若有不对的地方，欢迎提出。

下面是这道题的代码，这道题提示中说数据量很大，最好用scanf,用cin其实也可以过，不过时间多了15MS

#include <stdio.h> const int MAX=1000; int father[MAX]; //初始化函数 void Init(int n) { int i; for(i=1;i<=n;i++) father[i]=i; } //查找函数 int Find(int x) { while(father[x]!=x) x=father[x]; return x; } //合并函数 void combine(int a,int b) { int temp_a,temp_b; temp_a=Find(a); temp_b=Find(b); if(temp_a!=temp_b) father[temp_a]=temp_b; } //确定连通分量个数 int find_ans(int n) { int i,sum=0; for(i=1;i<=n;++i) if(father[i]==i) ++sum; return sum; } int main() { int i,n,m,a,b; while(scanf("%d",&n)!=EOF) { if(!n) break; Init(n); scanf("%d",&m); for(i=0;i<m;++i) { scanf("%d%d",&a,&b); combine(a,b); } printf("%d\n",find_ans(n)-1); } return 0; }

1. 简述

并查集是一种树型的数据结构，用于处理一些不相交集合（Disjoint Sets）的合并及查询问题。常常在使用中以森林来表示。需要实现的操作有：合并两个集合，判断两个元素是否属于一个集合。这里介绍的主要是普通的并查集，很多情况下使用的并查集是需要扩展的，根据使用情况的不同，有很多差别，这里仅仅是最基本的算法。

2. 复杂度

T=O(n*α(n)) ，其中α(x)，对于x=宇宙中原子数之和，α(x)不大于4。事实上，路经压缩后的并查集的复杂度是一个很小的常数。3. 伪代码

没有使用路径压缩和启发式的方法。

// 初始化并查集 #define N 100 int father[N]; void init() { for(int i=0; i<N; i++) father[i] = i; } // 合并两个元素所在的集合 void union( int x, int y) { x = getfather(x); y = getfather(y); if (x != y ) father[x] = y;} // 判断两个元素是否属于同一个集合 bool same( int x, int y) { return getfather(x) == getfather(y);} // 获取根结点 int getfather( int x) { while (x != father[x] ) x = father[x]; return x;}

使用路径压缩，改进getfather。

// 获取根结点 int getfather( int x) { if (x != father[x]) father[x] = getfather(father[x]); // 路径压缩修改的是father数组 return father[x];}

另外，还可以改进union，把数量少的集合合并到数量大的集合中，不过这就要记录每个集合中的元素数量，相当于增加了O（N）的存储空间，而且在getfather中也应该保持对元素数量的维护，相对代码复杂度偏高，而且感觉性能提升不多，这里就不写了。

1. 并查集（Union-Find Sets）  一种树型数据结构，用于处理不相交集合（Disjoint Sets）的合并以及查询；一开始让所有元素独立成树，也就是只有根节点的树；然后根据需要将关联的元素（树）进行合并；合并的方式仅仅是将一棵树最原始的节点的父亲索引指向另一棵树；  优化：加入一个rank数组存储节点深度的下界（从当前节点到其最远子节点的距离），从而可以启发式的对树进行合并，从而减少树的深度，防止树的退化；使得包含较少节点的树根指向包含较多节点的树根，具体指代为树的高度；另一个优化就是路径压缩，尽可能将子节点都直接连接到根节点之后；  并查集的空间复杂度为O(N)，构建一个集合的时间复杂度为O(N)；压缩后的查找复杂度是一个很小的常数；应用：Kruskal算法求最小生成树中判断新加入的边是否在同一棵树内部；两个节点的最近公共祖先(Least Common Ancestors)；初始化father：各个节点独立成树，并且其father[i]=i，也就是其父节点就是其自身； father[i] 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 初始化rank：各个节点为根节点，所以高度都为1； rank[i] 0 1 2 3 4 5 6 7 8 9 1 1 1 1 1 1 1 1 1 1 合并2和6：由于rank[2]=rank[6]，所以将2的父亲索引指向6，这样2和6就在同一棵树；并需将6的rank值增加1； father[i] 0 1 2 3 4 5 6 7 8 9 0 1 6 3 4 5 6 7 8 9 rank[i] 0 1 2 3 4 5 6 7 8 9 1 1 1 1 1 1 2 1 1 1 下述为代码实现： int *father; int *rank; /** * 并查集的初始化： * 数组father中的元素在最开始ide时候都是独立的树，也就是只有根节点 * 的树，数组father的下标i表示节点，而father[i]的值表示i节点的父亲 * 节点；rank[i]=1表示一开始所有树节点的高度都为1 * */ void init(int cap) { father=new int[cap]; rank=new int[cap]; /** * 时间复杂度为O(N) * */ for(int i=0;i<10;i++) { father[i]=i; rank[i]=1; } } void clean() { delete [] father; delete [] rank; } /** * 查找元素所在的集合并进行路劲压缩： * 由于需要频繁使用GetFather（）函数，并且其时间复杂度受树结构影响； * 当元素较多的时候，集合退化成链表，则GetFather()需要O(N)，所以 * 需要对其进行优化，每次调用GetFather（）的时候都将输入元素压缩成 * 最原始父亲节点的直接子节点 * */ int GetFather(int son) { if(father[son]==son) return son; else { father[son]=GetFather(father[son]); return father[son]; } } /** * 合并两个不相交的集合: * 输入元素x和y来自两个不相交的集合，找到其最原始的父亲节点 * 并将一个原始父亲节点设置为另一个原始父亲节点的父亲节点 * */ void Union1(int x, int y) { /** * GetFather()为递归寻找输入节点的最原始的父亲节点 * */ int fx=GetFather(x); int fy=GetFather(y); /** * 判断x和y是否来自同一棵树，如果不是才进行赋值；其实可以 * 不同进行判断（省去if语句） * 注意最原始父亲节点的father[i]=i; * */ if(fx!=fy) father[fx]=fy; } /** * 利用rank加权数组启发式进行合并 * */ void Union2(int x, int y) { int fx=GetFather(x); int fy=GetFather(y); if(fx==fy) return; /** * rank[fx]较大，说明其越靠近根节点，则将 * fy连接到其后面可以压缩路径 * */ if(rank[fx]>rank[fy]) father[fy]=fx; else { if(rank[fx]==rank[fy]) rank[fy]++; father[fx]=fy; } } /** * 判断两个元素是否属于同一个集合： * 利用GetFather（）函数判断其最原始父亲节点是否相同 * */ bool IsSameSet(int x, int y) { return GetFather(x)==GetFather(y); }

转载请注明原文地址: https://ju.6miu.com/read-1304045.html

最新回复(0)