Part 4.6：强连通分量 (SCC)——将复杂图分解为核心簇

引言：寻找图中的“小团体”

在一个有向图中，如果从顶点 u 可以到达 v，同时从 v 也可以回到 u，我们就说 u 和 v 是强连通的。这个概念可以扩展到一组顶点：如果一个子图中的任意两个顶点都相互强连通，那么这个子图就是一个强连通子图。

强连通分量 (Strongly Connected Component, SCC) 就是一个有向图中的极大强连通子图。所谓“极大”，是指在这个子图中再加入任何一个图中的其他顶点，它就不再强连通了。

直观理解：你可以把一个 SCC 看作图中的一个“紧密小团体”，团体内的任何成员都可以互相“访问”，而一旦离开这个团体，就可能再也回不来了。

将一个复杂的有向图分解成它的 SCC，可以极大地简化问题。我们可以先将每个 SCC 缩成一个点，得到一个有向无环图 (DAG)，然后在这个 DAG 上应用我们之前学过的算法（如拓扑排序）。

Tarjan 算法：基于 DFS 的优雅解法

求解 SCC 最著名、最高效的算法之一是 Tarjan 算法，由计算机科学家 Robert Tarjan 在 1972 年提出。它仅需一次深度优先搜索 (DFS) 即可找出所有的强连通分量。

核心思想

Tarjan 算法的核心是利用 DFS 过程中节点的访问顺序和两个关键数组：dfn 和 low。

dfn[u] (Depth First Number)：在 DFS 中，顶点 u 被搜索到的时间戳（或顺序号）。
low[u] (Lowest Reachable Ancestor)：从顶点 u 出发，通过 DFS 树中的边以及最多一条非树边（回边），能够到达的时间戳最小的顶点的 dfn 值。

我们还需要一个栈，用于存储当前正在访问的路径上的顶点。

强连通分量的判定规则：

在 DFS 的回溯过程中，如果一个顶点 u 满足 dfn[u] == low[u]，那么 u 就是这个 SCC 在 DFS 树中的根。此时，栈中从 u 到栈顶的所有顶点，共同构成一个强连通分量。

算法步骤

初始化 dfn 和 low 数组，一个空栈 stack，以及一个时间戳 timestamp。
遍历所有顶点，如果顶点未被访问，则对其进行 DFS (tarjan_dfs)。
在 tarjan_dfs(u) 函数中：
a. 设置 dfn[u] = low[u] = timestamp，timestamp 加一。
b. 将 u 入栈。
c. 遍历 u 的所有邻居 v：
i. 如果 v 未被访问，则递归调用 tarjan_dfs(v)，然后更新 low[u] = min(low[u], low[v])。
ii. 如果 v 已被访问且在栈中，说明 (u, v) 是一条指向栈中祖先节点的回边，更新 low[u] = min(low[u], dfn[v])。
d. 当 DFS 从 u 回溯时，检查是否 dfn[u] == low[u]。
i. 如果是，说明找到了一个 SCC。不断从栈中弹出元素，直到 u 被弹出。这些弹出的顶点共同构成一个 SCC。

Python 实现

from collections import defaultdict

class TarjanSCC:
    def __init__(self, graph, nodes):
        self.graph = graph
        self.nodes = nodes
        self.n = len(nodes)
        self.node_map = {node: i for i, node in enumerate(nodes)}
        self.rev_node_map = {i: node for i, node in enumerate(nodes)}
        
        self.dfn = [-1] * self.n
        self.low = [-1] * self.n
        self.stack = []
        self.on_stack = [False] * self.n
        self.timestamp = 0
        self.scc_count = 0
        self.sccs = []

    def find_sccs(self):
        for i in range(self.n):
            if self.dfn[i] == -1:
                self._tarjan_dfs(i)
        return self.sccs

    def _tarjan_dfs(self, u_idx):
        self.dfn[u_idx] = self.low[u_idx] = self.timestamp
        self.timestamp += 1
        self.stack.append(u_idx)
        self.on_stack[u_idx] = True
        
        u_node = self.rev_node_map[u_idx]
        if u_node in self.graph:
            for v_node in self.graph[u_node]:
                v_idx = self.node_map[v_node]
                if self.dfn[v_idx] == -1:
                    self._tarjan_dfs(v_idx)
                    self.low[u_idx] = min(self.low[u_idx], self.low[v_idx])
                elif self.on_stack[v_idx]:
                    self.low[u_idx] = min(self.low[u_idx], self.dfn[v_idx])
        
        # 找到一个 SCC 的根节点
        if self.low[u_idx] == self.dfn[u_idx]:
            scc = []
            while True:
                node_idx = self.stack.pop()
                self.on_stack[node_idx] = False
                scc.append(self.rev_node_map[node_idx])
                if u_idx == node_idx: break
            self.sccs.append(scc)
            self.scc_count += 1

# --- 案例测试 ---
nodes = ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H']
graph = {
    'A': ['B'],
    'B': ['C', 'E'],
    'C': ['D', 'G'],
    'D': ['A'],
    'E': ['F'],
    'F': ['H'],
    'G': ['F'],
    'H': ['G']
}

tarjan_solver = TarjanSCC(graph, nodes)
sccs = tarjan_solver.find_sccs()

print("找到的强连通分量:")
for scc in sccs:
    print(f"  {sorted(scc)}")

# 输出:
# 找到的强连通分量:
#   ['F', 'G', 'H']
#   ['E']
#   ['A', 'B', 'C', 'D']

复杂度分析

时间复杂度: O(V + E)。Tarjan 算法对每个顶点和每条边只访问一次。
空间复杂度: O(V)。用于存储 dfn, low 数组和递归栈。

经典应用

图的简化（缩点）：将每个 SCC 看作一个单一的“超级节点”，原图就被简化成一个 DAG。然后可以在这个 DAG 上应用其他算法，如拓扑排序、动态规划等。
2-SAT 问题：这是逻辑可满足性问题的一个变种，可以转化为求解图的 SCC 问题。
社交网络分析：识别社交网络中的“社区”或“小团体”。
模型检测：在软件工程中，用于检测系统状态机中的死锁或不可达状态。

总结

强连通分量是理解有向图结构的关键。通过将图分解为 SCC，我们可以将一个复杂的问题简化，先处理每个 SCC 内部的逻辑，再处理 SCC 之间的关系。

本文核心要点

✅ **强连通分量 (SCC)**：有向图中的极大强连通子图，内部任意两点可达。
✅ Tarjan 算法：基于 DFS，仅需一次遍历即可找出所有 SCC。
✅ 核心数据：dfn (时间戳) 和 low (最早能到达的祖先的时间戳)。
✅ 判定规则：当 dfn[u] == low[u] 时，u 是一个 SCC 的根。
✅ 应用：缩点、2-SAT 问题、社区发现等。

掌握了 Tarjan 算法，你就拥有了剖析有向图深层结构的强大能力。在下一篇文章中，我们将探讨图论中的匹配问题，从二分图匹配开始，看看如何解决资源分配和配对问题。

大学算法全体系 > Part 4：图论算法

#DFS #图论 #算法进阶 #强连通分量 #SCC #Tarjan算法

Part 4.6：强连通分量 (SCC)——将复杂图分解为核心簇

https://hjjjkh.github.io/posts/998851bc

作者

李国强

发布于

2025年11月27日

许可协议

Part 4.7：二分图匹配——月老的红线与匈牙利算法上一篇

Part 4.5：拓扑排序——安排任务的艺术下一篇