并查集

    xiaoxiao2025-11-10  7

    Problem Description  某省调查城镇交通状况,得到现有城镇道路统计表,表中列出了每条道路直接连通的城镇。省政府“畅通工程”的目标是使全省任何两个城镇间都可以实现交通(但不一定有直接的道路相连,只要互相间接通过道路可达即可)。问最少还需要建设多少条道路?  Input  测试输入包含若干测试用例。每个测试用例的第1行给出两个正整数,分别是城镇数目N ( < 1000 )和道路数目M;随后的M行对应M条道路,每行给出一对正整数,分别是该条道路直接连通的两个城镇的编号。为简单起见,城镇从1到N编号。  注意:两个城市之间可以有多条道路相通,也就是说  3 3  1 2  1 2  2 1  这种输入也是合法的  当N为0时,输入结束,该用例不被处理。  Output  对每个测试用例,在1行里输出最少还需要建设的道路数目。  Sample Input  4 2  1 3  4 3  3 3  1 2  1 3  2 3  5 2  1 2  3 5  999 0  0  Sample Output  1  0  2  998  Hint

    Huge input, scanf is recommended.

    畅通工程是并查集里面,非常基础且典型的一道题。

    相互连接的城市构成一个集合,只需要判断集合个数即可知道要修多少条路。

    集合个数的判断也可以根据每个集合只有一个根节点的特征,找n个数里有几个根节点,并减去1。

    为什么减去1?  3个孤独的城镇互联,只需要两条路,同理三个集合之间关联也只需要两条路,所以是集合总数减1。

    再说一下并查集,并查集的概念用数来理解较好,但是实现是用数组来实现的。

    就用上面这个图来简单说一下吧。

    令a,b,c,d组成一个集合,e,f,g组成另一个集合。

    谈到树的概念,树的维护用father数组,就是父节点,每一个树叶都有各自的父节点,最终会查询到这棵树的根节点,根节点是唯一的。例如:d的父节点是b,b的父节点是a,a是这棵树的根节点。

    如何判断d和c有联系呢?

    通过向上查找根节点,查看这两个点的根节点是否相同,即可知道它们两者是否有联系。

    d的根节点是a,c的父节点是a,同样a也是父节点→可以发现d和c的根节点相同,所以可以判断他们之间属于一个集合,即有联系。

    并查集,显然就是将集合合并起来。

    合并的意义就是让两个集合之间都可以相关联,判断关联与否在于父节点是否相同。

    因此,合并就是将一个树为主树(一般以节点个数多的为主),一个树扩展成主树的一条枝。

    修改只需要修改从树根节点的father值,将从树根节点的父节点设置为主树根节点。

    这样两个树就合并成一个树了。

    同右面的图,判断d和g是否相关联:

    d的根节点为a,g的父节点为f,f父节点e,e父节点为a,因为两者根节点相同,所以这两者是相关联的。

    这些都是我的理解,若有不对的地方,欢迎提出。

    下面是这道题的代码,这道题提示中说数据量很大,最好用scanf,用cin其实也可以过,不过时间多了15MS

    #include <stdio.h> const int MAX=1000; int father[MAX]; //初始化函数 void Init(int n) { int i; for(i=1;i<=n;i++) father[i]=i; } //查找函数 int Find(int x) { while(father[x]!=x) x=father[x]; return x; } //合并函数 void combine(int a,int b) { int temp_a,temp_b; temp_a=Find(a); temp_b=Find(b); if(temp_a!=temp_b) father[temp_a]=temp_b; } //确定连通分量个数 int find_ans(int n) { int i,sum=0; for(i=1;i<=n;++i) if(father[i]==i) ++sum; return sum; } int main() { int i,n,m,a,b; while(scanf("%d",&n)!=EOF) { if(!n) break; Init(n); scanf("%d",&m); for(i=0;i<m;++i) { scanf("%d%d",&a,&b); combine(a,b); } printf("%d\n",find_ans(n)-1); } return 0; }

    1. 简述

        并查集是一种树型的数据结构,用于处理一些不相交集合(Disjoint Sets)的合并及查询问题。常常在使用中以森林来表示。    需要实现的操作有:合并两个集合,判断两个元素是否属于一个集合。    这里介绍的主要是普通的并查集,很多情况下使用的并查集是需要扩展的,根据使用情况的不同,有很多差别,这里仅仅是最基本的算法。

    2. 复杂度

        T=O(n*α(n)) , 其中α(x),对于x=宇宙中原子数之和,α(x)不大于4。事实上,路经压缩后的并查集的复杂度是一个很小的常数。3. 伪代码   

        没有使用路径压缩和启发式的方法。

    // 初始化并查集 #define N 100 int father[N]; void init() {     for(int i=0; i<N; i++)       father[i] = i; } //  合并两个元素所在的集合 void  union( int  x, int  y) {    x  =  getfather(x);    y  =  getfather(y);     if (x != y )       father[x] = y;} //  判断两个元素是否属于同一个集合 bool  same( int  x, int  y) {     return  getfather(x) == getfather(y);} //  获取根结点 int  getfather( int  x) {     while (x != father[x] )      x  =  father[x];     return  x;}

        使用路径压缩,改进getfather。

    //  获取根结点 int  getfather( int  x) {     if (x  !=  father[x])      father[x]  =  getfather(father[x]); // 路径压缩修改的是father数组      return  father[x];}

        另外,还可以改进union,把数量少的集合合并到数量大的集合中,不过这就要记录每个集合中的元素数量,相当于增加了O(N)的存储空间,而且在getfather中也应该保持对元素数量的维护,相对代码复杂度偏高,而且感觉性能提升不多,这里就不写了。

    1. 并查集(Union-Find Sets)  一种树型数据结构,用于处理不相交集合(Disjoint Sets)的合并以及查询;一开始让所有元素独立成树,也就是只有根节点的树;然后根据需要将关联的元素(树)进行合并;合并的方式仅仅是将一棵树最原始的节点的父亲索引指向另一棵树;  优化:加入一个rank数组存储节点深度的下界(从当前节点到其最远子节点的距离),从而可以启发式的对树进行合并,从而减少树的深度,防止树的退化;使得包含较少节点的树根指向包含较多节点的树根,具体指代为树的高度;另一个优化就是路径压缩,尽可能将子节点都直接连接到根节点之后;  并查集的空间复杂度为O(N),构建一个集合的时间复杂度为O(N);压缩后的查找复杂度是一个很小的常数;应用:Kruskal算法求最小生成树中判断新加入的边是否在同一棵树内部;两个节点的最近公共祖先(Least Common Ancestors); 初始化father:各个节点独立成树,并且其father[i]=i,也就是其父节点就是其自身; father[i] 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 初始化rank:各个节点为根节点,所以高度都为1; rank[i] 0 1 2 3 4 5 6 7 8 9 1 1 1 1 1 1 1 1 1 1 合并2和6:由于rank[2]=rank[6],所以将2的父亲索引指向6,这样2和6就在同一棵树;并需将6的rank值增加1; father[i] 0 1 2 3 4 5 6 7 8 9 0 1 6 3 4 5 6 7 8 9 rank[i] 0 1 2 3 4 5 6 7 8 9 1 1 1 1 1 1 2 1 1 1 下述为代码实现: int *father; int *rank; /**  * 并查集的初始化:  * 数组father中的元素在最开始ide时候都是独立的树,也就是只有根节点  * 的树,数组father的下标i表示节点,而father[i]的值表示i节点的父亲  * 节点;rank[i]=1表示一开始所有树节点的高度都为1  * */ void init(int cap) {         father=new int[cap];         rank=new int[cap];         /**          * 时间复杂度为O(N)          * */         for(int i=0;i<10;i++) {                 father[i]=i;                 rank[i]=1;         } } void clean() {         delete [] father;         delete [] rank; } /**  * 查找元素所在的集合并进行路劲压缩:  * 由于需要频繁使用GetFather()函数,并且其时间复杂度受树结构影响;  * 当元素较多的时候,集合退化成链表,则GetFather()需要O(N),所以  * 需要对其进行优化,每次调用GetFather()的时候都将输入元素压缩成  * 最原始父亲节点的直接子节点  * */ int GetFather(int son) {         if(father[son]==son)                 return son;         else {                 father[son]=GetFather(father[son]);                 return father[son];         } } /**  * 合并两个不相交的集合:  * 输入元素x和y来自两个不相交的集合,找到其最原始的父亲节点  * 并将一个原始父亲节点设置为另一个原始父亲节点的父亲节点  * */ void Union1(int x, int y) {         /**          * GetFather()为递归寻找输入节点的最原始的父亲节点          * */         int fx=GetFather(x);         int fy=GetFather(y);         /**          * 判断x和y是否来自同一棵树,如果不是才进行赋值;其实可以          * 不同进行判断(省去if语句)          * 注意最原始父亲节点的father[i]=i;          * */         if(fx!=fy)                 father[fx]=fy; } /**  * 利用rank加权数组启发式进行合并  * */ void Union2(int x, int y) {         int fx=GetFather(x);         int fy=GetFather(y);         if(fx==fy) return;         /**          * rank[fx]较大,说明其越靠近根节点,则将          * fy连接到其后面可以压缩路径          * */         if(rank[fx]>rank[fy])                 father[fy]=fx;         else {                 if(rank[fx]==rank[fy])                         rank[fy]++;                 father[fx]=fy;         } } /**  * 判断两个元素是否属于同一个集合:  * 利用GetFather()函数判断其最原始父亲节点是否相同  * */ bool IsSameSet(int x, int y) {         return GetFather(x)==GetFather(y); }   
    转载请注明原文地址: https://ju.6miu.com/read-1304045.html
    最新回复(0)