Python常用数据结构：堆的实现与应用

Python常用数据结构：堆的实现与应用

在计算机科学中，堆是一种特殊的树形数据结构，它满足堆属性：父节点的键值总是保持固定的序关系于任何一个子节点的键值，且每个节点的左子树和右子树都是一个堆。在堆中没有节点的右子节点为空节点。因此，堆是一种完全二叉树。

堆可以应用在很多场景中，例如实现优先队列，最短路径算法，排序算法等。在Python中，我们很容易地实现一个堆。

1. 堆的实现

在Python中，我们可以使用heapq模块来实现一个堆。heapq支持基于列表上的堆操作。具体来说，我们可以使用heapq模块的heapify()方法将一个列表转换成一个小根堆或者大根堆。而heapq模块还提供了一系列的操作，例如push，pop等。

下面是一个小根堆的代码：

```python
import heapq

heap = []
heapq.heappush(heap, 2)
heapq.heappush(heap, 1)
heapq.heappush(heap, 3)

print(heapq.heappop(heap))  # 输出 1
print(heapq.heappop(heap))  # 输出 2
print(heapq.heappop(heap))  # 输出 3
```

运行结果：

```
1
2
3
```

上述代码中，我们首先使用heappush()方法将元素2，1和3依次加入到堆中。然后，我们通过heappop()方法依次弹出堆中的元素，由于是小根堆，因此我们依次得到的是1，2和3。

堆的应用

2.1 实现优先队列

在日常的生活中，我们经常需要使用优先队列来实现先来先服务的机制，但是在一些场景中，我们需要优先处理一些特定的任务。这时，我们就需要使用优先队列的机制了。在Python中，我们可以利用heapq模块来实现优先队列。

下面是一个实现优先队列的代码：

```python
import heapq

class PriorityQueue:
    def __init__(self):
        self._queue = []
        self._index = 0

    def push(self, item, priority):
        heapq.heappush(self._queue, (-priority, self._index, item))
        self._index += 1

    def pop(self):
        return heapq.heappop(self._queue)[-1]
```

运行结果：

```python
q = PriorityQueue()
q.push('task 1', 1)
q.push('task 2', 4)
q.push('task 3', 3)
q.push('task 4', 2)

print(q.pop())  # 输出 task 2
print(q.pop())  # 输出 task 3
print(q.pop())  # 输出 task 4
print(q.pop())  # 输出 task 1
```

在上述代码中，我们首先定义了一个PriorityQueue类，该类包含了push和pop方法。push方法用于将数据元素和优先级加入到堆中，由于Python支持元组的比较，因此我们可以将(-priority，self._index, item)加入到堆中。pop方法用于弹出堆中具有最高优先级的数据元素。

2.2 实现最短路径算法

在计算机科学中，最短路径算法是一种用于查找两个节点之间最短路径的算法。在Python中，我们可以使用heapq模块来实现最短路径算法。

下面是一个实现最短路径算法的代码：

```python
import heapq

def dijkstra(edges, start, end):
    graph = {}
    for e in edges:
        src, dest, weight = e
        if src not in graph:
            graph[src] = [(dest, weight)]
        else:
            graph[src].append((dest, weight))

    heap = [(0, start, [])]
    visited = set()

    while heap:
        (cost, node, path) = heapq.heappop(heap)
        if node not in visited:
            visited.add(node)
            path = path + [node]
            if node == end:
                return (cost, path)

            for neighbor, weight in graph.get(node, []):
                heapq.heappush(heap, (cost + weight, neighbor, path))

    return float("inf")

edges = [("A", "B", 3), ("A", "C", 2), ("B", "D", 2), ("C", "D", 1), ("C", "E", 4), ("D", "E", 1)]
print(dijkstra(edges, "A", "E"))
```

在上述代码中，我们首先定义了一个dijkstra函数，该函数用于实现最短路径算法。该函数接收三个参数，分别是边的列表edges，起始节点start和目标节点end。

在dijkstra函数中，我们首先将边的列表edges转换成字典类型的图graph。然后，我们将起始节点加入到堆中，并初始化visited和path两个集合。接下来，我们通过while循环遍历堆，直到堆为空为止。在遍历堆的过程中，我们首先弹出堆中具有最小花费的元素，然后将其加入到visited和path中。如果当前节点是目标节点，那么我们直接返回当前节点的花费和路径。否则，我们遍历当前节点的邻居节点，将邻居节点加入到堆中，并更新邻居节点的花费。

最后，我们将边的列表edges和起始节点"A"和目标节点"E"作为参数调用dijkstra函数，并打印出最短路径和最小花费。

总结

在计算机科学中，堆是一种特殊的树形数据结构，它可以应用在很多场景中，例如实现优先队列，最短路径算法，排序算法等。在Python中，我们可以使用heapq模块来实现堆的操作，包括将列表转换成堆，向堆中加入元素，从堆中弹出元素等操作。
首页

课程中心

免费公开课

技术干货

就业动态

马哥动态

Python常用数据结构：堆的实现与应用