栈是一种“受限访问的线性结构”,其访问规则是:先入后出。
1 概念
栈(Stack)是一种遵循先入后出逻辑的线性数据结构。
我们可以将栈类比为桌面上的一摞盘子,规定每次只能移动一个盘子,那么想取出底部的盘子,则需要先将上面的盘子依次移走。我们将盘子替换为各种类型的元素(如整数、字符、对象等),就得到了栈这种数据结构。
如 图 1-1 所示,我们把堆叠元素的顶部称为“栈顶”,底部称为“栈底”。将把元素添加到栈顶的操作叫作“入栈”,删除栈顶元素的操作叫作“出栈”。
1.1 栈的常用操作
栈的常用操作如下表所示,具体的方法名需要根据所使用的编程语言来确定。在此,我们以常见的 push() 、 pop() 、 peek() 命名为例。
| 方法 |
描述 |
时间复杂度 |
push() |
元素入栈(添加至栈顶) |
O(1) |
pop() |
栈顶元素出栈 |
O(1) |
peek() |
访问栈顶元素 |
O(1) |
通常情况下,我们可以直接使用编程语言内置的栈类。然而,某些语言可能没有专门提供栈类,这时我们可以将该语言的“数组”或“链表”当作栈来使用,并在程序逻辑上忽略与栈无关的操作。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22
|
stack: list[int] = []
stack.append(1) stack.append(3) stack.append(2) stack.append(5) stack.append(4)
peek: int = stack[-1]
pop: int = stack.pop()
size: int = len(stack)
is_empty: bool = len(stack) == 0
|
2 栈的实现
为了深入了解栈的运行机制,我们来尝试自己实现一个栈类。
栈遵循先入后出的原则,因此我们只能在栈顶添加或删除元素。然而,数组和链表都可以在任意位置添加和删除元素,因此栈可以视为一种受限制的数组或链表。换句话说,我们可以“屏蔽”数组或链表的部分无关操作,使其对外表现的逻辑符合栈的特性。
2.1 基于链表的实现
使用链表实现栈时,我们可以将链表的头节点视为栈顶,尾节点视为栈底。
如 图 2-1 所示,对于入栈操作,我们只需将元素插入链表头部,这种节点插入方法被称为“头插法”。而对于出栈操作,只需将头节点从链表中删除即可。
一下是基于链表实现栈的示例代码:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62
| typedef struct { ListNode *top; int size; } LinkedListStack;
LinkedListStack *newLinkedListStack() { LinkedListStack *s = malloc(sizeof(LinkedListStack)); s->top = NULL; s->size = 0; return s; }
void delLinkedListStack(LinkedListStack *s) { while (s->top) { ListNode *n = s->top->next; free(s->top); s->top = n; } free(s); }
int size(LinkedListStack *s) { return s->size; }
bool isEmpty(LinkedListStack *s) { return size(s) == 0; }
void push(LinkedListStack *s, int num) { ListNode *node = (ListNode *)malloc(sizeof(ListNode)); node->next = s->top; node->val = num; s->top = node; s->size++; }
int peek(LinkedListStack *s) { if (s->size == 0) { printf("栈为空\n"); return INT_MAX; } return s->top->val; }
int pop(LinkedListStack *s) { int val = peek(s); ListNode *tmp = s->top; s->top = s->top->next; free(tmp); s->size--; return val; }
|
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45
| class LinkedListStack: """基于链表实现的栈"""
def __init__(self): """构造方法""" self._peek: ListNode | None = None self._size: int = 0
def size(self) -> int: """获取栈的长度""" return self._size
def is_empty(self) -> bool: """判断栈是否为空""" return self._size == 0
def push(self, val: int): """入栈""" node = ListNode(val) node.next = self._peek self._peek = node self._size += 1
def pop(self) -> int: """出栈""" num = self.peek() self._peek = self._peek.next self._size -= 1 return num
def peek(self) -> int: """访问栈顶元素""" if self.is_empty(): raise IndexError("栈为空") return self._peek.val
def to_list(self) -> list[int]: """转化为列表用于打印""" arr = [] node = self._peek while node: arr.append(node.val) node = node.next arr.reverse() return arr
|
2.2 基于数组的实现
使用数组实现栈时,我们可以将数组的尾部作为栈顶。如 图 2-2 所示,入栈与出栈操作分别对应在数组尾部添加元素与删除元素,时间复杂度都为 O(1) 。
由于入栈的元素可能会源源不断地增加,因此我们可以使用动态数组,这样就无须自行处理数组扩容问题。以下为示例代码:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56
| typedef struct { int *data; int size; } ArrayStack;
ArrayStack *newArrayStack() { ArrayStack *stack = malloc(sizeof(ArrayStack)); stack->data = malloc(sizeof(int) * MAX_SIZE); stack->size = 0; return stack; }
void delArrayStack(ArrayStack *stack) { free(stack->data); free(stack); }
int size(ArrayStack *stack) { return stack->size; }
bool isEmpty(ArrayStack *stack) { return stack->size == 0; }
void push(ArrayStack *stack, int num) { if (stack->size == MAX_SIZE) { printf("栈已满\n"); return; } stack->data[stack->size] = num; stack->size++; }
int peek(ArrayStack *stack) { if (stack->size == 0) { printf("栈为空\n"); return INT_MAX; } return stack->data[stack->size - 1]; }
int pop(ArrayStack *stack) { int val = peek(stack); stack->size--; return val; }
|
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34
| class ArrayStack: """基于数组实现的栈"""
def __init__(self): """构造方法""" self._stack: list[int] = []
def size(self) -> int: """获取栈的长度""" return len(self._stack)
def is_empty(self) -> bool: """判断栈是否为空""" return self.size() == 0
def push(self, item: int): """入栈""" self._stack.append(item)
def pop(self) -> int: """出栈""" if self.is_empty(): raise IndexError("栈为空") return self._stack.pop()
def peek(self) -> int: """访问栈顶元素""" if self.is_empty(): raise IndexError("栈为空") return self._stack[-1]
def to_list(self) -> list[int]: """返回列表用于打印""" return self._stack
|
3 两种实现对比
支持操作
两种实现都支持栈定义中的各项操作。数组实现额外支持随机访问,但这已超出了栈的定义范畴,因此一般不会用到。
时间效率
在基于数组的实现中,入栈和出栈操作都在预先分配好的连续内存中进行,具有很好的缓存本地性,因此效率较高。然而,如果入栈时超出数组容量,会触发扩容机制,导致该次入栈操作的时间复杂度变为 O(n) 。
在基于链表的实现中,链表的扩容非常灵活,不存在上述数组扩容时效率降低的问题。但是,入栈操作需要初始化节点对象并修改指针,因此效率相对较低。不过,如果入栈元素本身就是节点对象,那么可以省去初始化步骤,从而提高效率。
综上所述,当入栈与出栈操作的元素是基本数据类型时,例如 int 或 double ,我们可以得出一下结论。
- 基于数组实现的栈在触发扩容时效率会降低,但由于扩容是低频操作,因此平均效率更高。
- 基于链表实现的栈可以提供更加稳定的效率表现。
空间效率
在初始化列表时,系统会为列表分配“初始容量”,该容量可能超出实际需求;并且,扩容机制通常是按照特定倍率(例如 2 倍)进行扩容的,扩容后的容量也可能超出实际需求。因此,基于数组实现的栈可能造成一定的空间浪费。
然而,由于链表节点需要额外存储指针,因此链表节点占用的空间相对较大。
综上,我们不能简单地确定哪种实现更加节省内存,需要针对具体情况进行分析。
4 栈的典型应用