目录
- 1.图的表示
- 2.广度优先搜索
- 3.深度优先搜索——本质等同于回溯
- 4.拓扑排序
- 5.强连通分量
1.图的表示
- 邻接链表是表示稀疏图(|E| << |V|²)通常的选择
1)由一个包含|V|条链表的所组成,每个结点一条链表。
2)对于每个结点u∈V,邻接链表Adj[u]包含所有与结点u之间有边相连的结点v
3)邻接链表表示法的存储空间需求是Θ(V+E) - 邻接矩阵是表示稠密图(|E| ≈ |V|²)的通常选择
如果需要快速判断任意两个结点之间是否有边连接,可能也需要邻接矩阵表示法。
1)邻接矩阵是由一个|V| x |V|的矩阵A = (aij)表示的
2.广度优先搜索
- 图的搜索:系统化地跟随图中的边来访问图中的每个结点。
图搜索算法可以用来发现图的结构。许多图算法在一开始都会先通过搜索来获得图的结构,其他的一些图算法则是对基本的搜索加以优化。
图的搜索技巧是整个图算法领域的核心。 - Prim最小生成树算法和Dijkstra单源最短路径算法都使用了类似广度优先搜索的思想。
2.1 广度优先搜索
广度优先搜索的特点:算法始终是沿着 已发现结点和未发现结点边界 的广度方向向外扩展。
即算法需要在发现所有距离源节点s为k(k条边)的所有结点之后,才会发现距离源节点s为k+1的其他节点。结点分为三类:
白色:开始时都涂为白色
黑色:所有与黑色结点邻接的结点都已被发现
灰色:其邻接结点中可能存在未被发现的白色结点。(是已知和未知两个集合之间的边界。)执行广度优先搜索的过程中,将构造出一棵以s为根的广度优先树。
-
队列Q中管理灰色结点集
-
BFS计算出的广度优先树可以因邻接链表中的次序不同而不同,但是结点u的u.d值与次序无关。
与距离为d相邻接的白色边,全为d+1,广度优先树的搜索次序会将d+1的边连接到不同的d边上,但不会改变其距离。
BFS的运行时间:
1)每个结点入队和出对最多一次,总时间为O(V)
2)对每个结点进行邻接链表扫描(最多一次),因此扫描邻接链表的时间为O(E)
总时间为O(V + E)
2.2 最短路径
- 定义从源节点s到结点v的最短路径距离δ(s, v)为从结点s到结点v之间所有路径里面最少的边数。
从结点s到结点v的长度为δ(s, v)的路径为s到v的最短路径。
- 定理22.3其实本质上是指:当删除一个距离为d的结点时,才会将结点相邻的结点加入进来,此时距离为d+1。所以队列中头尾最大差1.
- 22.5的理解:
1)关键点:v是第一个不满足要求的结点,u是s到v的最短路径上v的前驱
2)v分别是三种颜色时,此时假设结点u还在队列中
2.3 广度优先树
- 对于图G=(V, E)和源节点s,定义图G的前驱子图为Gπ = (Vπ, Eπ),其中:
Vπ={v∈V: v.π ≠ NIL} ∪ {s}
Eπ = {(v.π, v): v∈Vπ - {s}} - 如果Vπ由源节点s可以到达的结点组成,并且对于所有的v∈Vπ,子图Gπ包含一条从源节点s到结点v的唯一简单路径,且该路径也是图G里面从源节点s到结点v之间的一条最短路径,则前驱子图Gπ是一棵广度优先树。
|Eπ| = |Vπ| - 1
3.深度优先搜索——本质等同于回溯
3.1 深度优先搜索
- (回溯)只要可能,就在图中尽量“深入”。
深度优先搜索总是对最近才发现的结点v的出发边进行搜索,直到该节点的所有出发边都被发现为止。一旦结点v的所有出发边都被发现,搜索则回溯到v的前驱结点,来搜索该前驱结点的其他出发边。
该过程一直持续到从源节点可以达到的所有结点都被发现为止。 -
前驱子图:Gπ = (V, Eπ),其中:
Eπ = {(v.π, v): v∈V且v.π ≠ NIL }
深度优先搜索的前驱子图形成一个由多棵深度优先树构成的深度优先森林。森林Eπ中的边称为树边。
深度优先搜索的前驱子图可能由多棵树组成,因为搜索可能从多个源节点重复进行。 -
结点分为三类:
白色:开始时都涂为白色
黑色:其邻接链表被扫描完成后变为黑色。
灰色:其邻接结点中可能存在未被发现的白色结点。(是已知和未知两个集合之间的边界。)
该方法可以保证每个结点仅在一棵深度优先树中出现,因此,所有的深度优先树是不相交的。 - 每个结点盖上时间戳:
1)v.d:记录结点v第一次被发现的时间(涂上灰色的时候)
2)v.d:对v的链接链表完成搜索扫描的时间(涂上黑色的时间)
结点v在v.d之前是白色,在v.d和v.f之间为灰色,在v.f之后是黑色。
- 运行时间:
DFS-VISIT被调用的次数刚好为一次,只有当u为白色的时候,才调用。Θ(V)。
遍历邻接遍历总共执行的是Θ(E)。
总共Θ(V + E)
3.2 深度优先搜索的性质
- 深度优先搜索具有括号化结构
3.3 边的分类
在图G上运行深度优先搜索算法所生成的深度优先森林Gπ,定义四种边的类型:
1)树边
为深度优先森林Gπ中的边。如果结点v是因算法对边(u, v)的探索而首先被发现,则(u, v)是一条树边
2)后向边
后向边(u,v)是将结点u连接到其在深度优先树中(一个)祖先结点v的边。由于有向图可以有自循环,自循环也被认为是后向边。
3)前向边
是将结点u连接到其在深度优先树中一个后代结点v的边(u, v)
4)横向边
指其他所有的边。这些边可以连接同一棵深度优先树中的结点,只要其中一个结点不是另一个结点的祖先,也可以连接不同深度优先树中的两个结点。当第一次探索边(u, v)时
1)结点v为白色表明该条边(u, v)是一条树边
2)结点v为灰色表明该条边(u, v)是一条后向边:v.d < u.d < u.f < v.f
3)结点v为黑色表明该条边(u, v)是一条前向边或横向边 v.f < u.f:有两种情况-
对边进行分类时,为了消除无向图的模糊性:
将边(u, v)花费为分类列表中第一种适合该边的类型;
可以根据搜索算法时是先搜索到边(u, v)还是(v, u)来进行分类
该定理的关键点:第一次探索边(u ,v),分为两种情况。
一种是u->v方向,这时是树边
第二种是v->u方向,这时是后向边
4.拓扑排序
- 使用深度优先搜索对有向无环图进行拓扑排序
- (拓扑排序)对于一个有向无环图G = (V, E)来说,其拓扑排序是G中所有结点的一种线性次序,该次序满足如下条件:
如果图G包含边(u ,v),则结点u在拓扑排序中出于结点v的前面(如果G含有回路,则不可能排出一个线性次序)。
- 拓扑排序的本质是:按照其完成时间的逆序被排成从左至右的一条水平线。所有的有向边都是从左指向右。
- 运行时间:深度优先搜索的运行时间为Θ(V + E),将结点插入到链表最前端所需的时间为O(1),一共只有|V|结点需要插入,总共需要Θ(V + E)时间
- 定理22.12能够成立的原因是:因为没有后向边
5.强连通分量
5.1 强连通算法
(强连通)如果一个有向图中任意两个顶点互相可达,则该有向图是强连通的。有向图的强连通分量是“相互可达”关系下顶点的等价类。
有向图G = (V, E)的强连通分量是一个最大结点集合 C包含于V,对于该集合中的任一对结点u和v来说,路径 u ->...-> v和v ->...-> u同时存在,也就是u和v可以互相可达。(转置GT)寻找连通分量的算法需要用到图G=(V, E)的转置,将其定义为GT = (V, ET)
ET = {(u, v): (v, u) ∈ E}
ET是由图G中的边进行反向而获得的。
图G和GT的强连通分量是完全相同的(算法)在Θ(V + E)时间使用使用两次深度优先搜索来计算有向图G = (V, E)的强连通分量。这两次搜索一次运行在G上,一次运行在GT上。
-
第二次实际上是以拓扑排序的次序来访问分量图中的结点。
- 算法的思想来自于图GSCC = (VSCC, ESCC)的一个关键性质,这个关键性质定义如下:
假定图G有强连通分量C1, C2, ..., Ck。结点集VSCC为{v1, v2, ..., vk},对于图G的每个强连通分量Ci来说,该集合包含代表该分量的结点vi。如果对于某个x∈Ci和y∈Cj,图G包含一条有向边(x, y),则边(vi, vj)∈ESCC。
另一个角度来看,通过收缩所有相邻结点都在同一个强连通分量中的边,剩下的图就是GSCC。
5.2 分量图是有向无环图
5.3 算法正确性
-
d(U)和f(U)分别是集合U中所有结点里最早的发现时间和最晚的完成时间。
- 算法的关键:对GT的深度优先搜索访问任意一个强连通分量时,从该连通分量发出的所有边只能是通向已经访问过的强连通分量。
- 从另一个角度来看第二次深度优先搜索的过程:
考虑GT的分量图(GT)SCC。如果将第二次深度优先搜索所访问的每个强连通分量映射到(GT)SCC的一个结点上,则第二次深度优先搜索将以拓扑排序的逆序来访问(GT)SCC中的结点。
如果将(GT)SCC中的边翻转过来,将获得图((GT)SCC)T。
因为((GT)SCC)T = GSCC,因此第二次深度优先搜索是以拓扑排序次序访问GSCC中的结点的。
上述等式的含义:转置图的分量图的转置与图G的分量图相同。