算法基础（4）

第二章数据结构

链表
栈与队列
kmp

这节课主要讲如何用数组模拟链表，栈与队列。

链表

我们知道链表可以通过结构体+指针来实现，但每次创建一个新节点就要通过new Node; 来实现，这一过程是很慢的，在做笔试题时一般不会采用这样的动态链表的方式，常用的是用数组来模拟链表，又分为两种：

单链表，其中在算法题中用的最多的是邻接表，它最主要的应用是存储图和树
双链表，主要作用是优化某些问题

关于链表的基础知识可以参考之前写的 Cpp基础（6）结构体与链表

数组模拟单链表：用两个数组e[N]和ne[N]，它们通过下标关联起来，下标从0开始，e[i]用来存放第i个节点的值，ne[i]用来存放第i个节点指向的next节点的下标，空节点的下标用-1来表示。

单链表例题（Acwing 826）：

实现一个单链表，链表初始为空，支持三种操作：

(1) 向链表头插入一个数；

(2) 删除第k个插入的数后面的数；

(3) 在第k个插入的数后插入一个数

现在要对该链表进行M次操作，进行完所有操作后，从头到尾输出整个链表。

注意:题目中第k个插入的数并不是指当前链表的第k个数。例如操作过程中一共插入了n个数，则按照插入的时间顺序，这n个数依次为：第1个插入的数，第2个插入的数，…第n个插入的数。

#include<iostream>
using namespace std;

const int N = 100010;

//head 表示头节点的下标
//e[i] 表示节点i的值
//ne[i] 表示节点i的next指针是多少（指向的下一个节点的下标）
//idx 表示当前已经用到了哪个点
int head, e[N], ne[N], idx;

//初始化
void init()
{
    head = -1;
    idx = 0;
}

//将x插到头节点
void add_to_head(int x)
{
    e[idx] = x, ne[idx] = head, head = idx ++;
}

//将x插到下标是k的点的后面（下标是k表示第k+1个插入链表中的数，与其位置无关）
void add(int k, int x)
{
    e[idx] = x, ne[idx] = ne[k], ne[k] = idx ++;
}

//将下标是k的点后面的点从链表中删除
void remove(int k)
{
    ne[k] = ne[ne[k]];
}

int main()
{
    int m;
    cin >> m;
    
    init();
    
    while( m-- )
    {
        int k, x;
        char op;
        
        cin >> op;
        if(op == 'H')
        {
            cin >> x;
            add_to_head(x);
        }
        else if(op == 'D')
        {
            cin >> k;
            if(!k)  head = ne[head];  //若要删除的节点是头节点
            remove(k - 1);   //下标从0开始，第k个插入的数下标是k-1
        }
        else
        {
            cin >> k >> x;
            add(k - 1, x);
        }
    }
    
    for(int i = head; i != -1; i = ne[i])  cout << e[i] << ' ';
    cout << endl;
    
    return 0;
}

双链表的每个节点有两个指针，一个指向前面的点，一个指向后面的点，用数组l[]存放节点左边的点的下标，用数组r[]存放节点右边的点的下标。这里我们偷个懒，让下标是0的点是head，让下标是1的点是tail。

双链表例题（Acwing 827）

实现一个双链表，双链表初始为空，支持5种操作：

(1) 在最左侧插入一个数；

(2) 在最右侧插入一个数；

(3) 将第k个插入的数删除；

(4) 在第k个插入的数左侧插入一个数；

(5) 在第k个插入的数右侧插入一个数

现在要对该链表进行M次操作，进行完所有操作后，从左到右输出整个链表。

#include<iostream>
using namespace std;

const int N = 100010;

int e[N], l[N], r[N], idx;

//初始化
void init()
{
    //0表示head， 1表示tail
    r[0] = 1, l[1] = 0;
    idx = 2;   //第k的插入的数下标就是k + 1
}

//在下标是k的点的右边插入x
void add(int k, int x)
{
    e[idx] = x;
    l[idx] = k, r[idx] = r[k];
    l[r[k]] = idx, r[k] = idx ++;  //注意这里的顺序不能变
}

//删除下标是k的节点
void remove(int k)
{
    r[l[k]] = r[k];
    l[r[k]] = l[k];
}

int main()
{
    int m;
    cin >> m;
    
    init();
    
    while(m --)
    {
        string op;
        cin >> op;
        int k, x;
        if(op == "L")   //注意这里要用双引号
        {
            cin >> x;
            add(0, x);
        }
        else if(op == "R")
        {
            cin >> x;
            add(l[1], x);
        }
        else if(op == "D")
        {
            cin >> k;
            remove(k + 1);
        }
        else if(op == "IL")
        {
            cin >> k >> x;
            add(l[k + 1], x);
        }
        else
        {
            cin >> k >> x;
            add(k + 1, x);
        }
    }
    
    for(int i = r[0]; i != 1; i = r[i])  cout << e[i] << ' ';
    cout << endl;
    
    return 0;
}

栈与队列

栈：先进后出
队列：先进先出

栈与队列的基础知识可以参考之前写的数据结构与算法（7）栈与队列

//****************栈
const int N = 100010;
int stk[N], tt;

//读入
stk[ ++ tt] = x;

//弹出
tt --;

//判断栈是否为空
if(tt > 0)  not empty;
else empty;

//取栈顶元素
stk[tt];

//******************队列

//在队尾插入元素，在队头弹出元素
int q[N], hh, tt = -1;

//插入
q[ ++ tt] = x;

//弹出
hh ++;

//判断队列是否为空
if(hh <= tt)  not empty;
else empty;

//取队头元素
q[hh];

//当然用数组模拟的队列还可以取队尾元素 q[tt];

数组模拟栈例题（Acwing 828）

实现一个栈，栈初始为空，支持四种操作：

(1) “push x” – 向栈顶插入一个数x；

(2) “pop” – 从栈顶弹出一个数；

(3) “empty” – 判断栈是否为空；

(4) “query” – 查询栈顶元素。

现在要对栈进行M个操作，其中的每个操作3和操作4都要输出相应的结果。数据范围：$1 \le M \le 100000$，$1 \le x \le 10^9$。所有操作保证合法。

#include<iostream>
using namespace std;

const int N = 100010;

int m;
int stk[N], tt;

int main()
{
    cin >> m;
    while(m --)
    {
        string op;
        int x;
        
        cin >> op;
        if(op == "push")
        {
            cin >> x;
            stk[++ tt] = x;
        }
        else if(op == "pop")  tt --;
        else if(op == "empty")  cout << (tt ? "NO" : "YES") << endl;
        else cout << stk[tt] << endl;
    }
    
    return 0;
}

数组模拟队列例题（ACwing 829）

实现一个队列，队列初始为空，支持四种操作：

(1) “push x” – 向队尾插入一个数x；

(2) “pop” – 从队头弹出一个数；

(3) “empty” – 判断队列是否为空；

(4) “query” – 查询队头元素。

现在要对队列进行M个操作，其中的每个操作3和操作4都要输出相应的结果。数据范围：$1 \le M \le 100000$，$1 \le x \le 10^9$。所有操作保证合法。

#include<iostream>
using namespace std;

const int N = 100010;
int m;
int q[N], hh, tt = -1;

int main()
{
    cin >> m;
    while(m --)
    {
        string op;
        int x;
        
        cin >> op;
        if(op == "push")
        {
            cin >> x;
            q[++ tt] = x;
        }
        else if(op == "pop")  hh ++;
        else if(op == "empty")  cout << (hh <= tt ? "NO" : "YES") << endl;
        else cout << q[hh] << endl;
    }
    
    return 0;
}

单调栈与单调队列

单调栈的常见题型：给定一个序列，求序列中每一个数左边离它最近的且比它小的数是多少。

例题：给定一个长度为N的整数数列，输出每个数左边第一个比它小的数，如果不存在则输出-1。

保证栈中的数是单调递增的，遍历数列中的数，对于数列中第i个数，若栈非空且栈顶元素大于等于它，就弹出栈顶，直到栈顶比它小，则栈顶即为所求；若栈空，说明不存所求。之后再把第i个数存入栈顶。

#include<iostream>
using namespace std;

const int N = 100010;

int stk[N], tt;

int main()
{
    int n;
    cin >> n;  //输入数据比较多时还是用scanf比较快
    
    while(n --)
    {
        int x;
        cin >> x;
        while(tt && stk[tt] >= x)  tt --;
        if(tt)  cout << stk[tt] << ' ';
        else cout << -1 << ' ';
        
        stk[++ tt] = x;
    }
    
    return 0;
}

对于每个元素，最多只会进栈一次出栈一次，因此时间复杂度为$O(n)$。

单调队列的常见题型：求滑动窗口中的最大值/最小值

例题：滑动窗口（Acwing 154）

遍历序列中的元素，i表示滑动窗口右端点元素的下标，用一个单调队列来维护当前的滑动窗口，保证队列中的元素是单调递增的，即每插入一个新元素，便判断队尾是否大于等于它，若是就弹出队尾，再把新元素插入队尾，这样每次求滑动窗口中的最小值只需取出队头即可。求滑动窗口中的最大值同理。

#include<iostream>
using namespace std;

int n, k;
const int N = 1000010;

int a[N], q[N];  //单调队列q[N]，存放下标

int main()
{
    scanf("%d%d", &n, &k);
    for(int i = 0; i < n; i++)  scanf("%d", &a[i]);
    
    //求滑动窗口中的最小值
    int hh = 0, tt = -1;  //队头和队尾
    for(int i = 0; i < n; i++)
    {
        //判断队头是否已经弹出窗口
        if(hh <= tt && i - k + 1 > q[hh])  hh++;  //每次只会出现一次，因此可以用if
        while(hh <= tt && a[q[tt]] >= a[i])  tt--;
        q[++ tt] = i;
        if(i >= k - 1)  printf("%d ", a[q[hh]]);
    }
    puts("");
    
    //求滑动窗口中的最大值
    hh = 0, tt = -1;  //队头和队尾
    for(int i = 0; i < n; i++)
    {
        //判断队头是否已经弹出窗口
        if(hh <= tt && i - k + 1 > q[hh])  hh++;
        while(hh <= tt && a[q[tt]] <= a[i])  tt--;
        q[++ tt] = i;
        if(i >= k - 1)  printf("%d ", a[q[hh]]);
    }
    puts("");
    
    return 0;
}

用单调栈或者单调队列解题的思路都是：先用暴力做法求解，再考虑暴力做法的栈或队列中哪些元素是没有用的，删掉这些没用的元素，再看剩下的元素有没有单调性，如果有就可以考虑用栈或队列做优化。

KMP

给定一个模式串S（长度为M），以及一个模板串P（长度为N），所有字符串中只包含大小写英文字母以及阿拉伯数字。模板串P在模式串S中多次作为子串出现。求出模板串P在模式串S中所有出现的位置的起始下标。

数据范围：$1 \le N \le 10^5$，$1 \le M \le 10^6$。

KMP算法的知识可以参考之前写的数据结构与算法（20）串——3.KMP算法

对于模板串要处理出一个：它的一个以第i个元素为右端点的后缀和一个前缀相等，相等的最大长度是多少。如next[i]=j，则说明p[1,j]=p[i-j+1]。

#include<iostream>
using namespace std;

const int N = 100010, M = 1000010;

int n, m;
char p[N], s[M];
int ne[N]; 

int main()
{
    cin >> n >> p + 1 >> m >> s + 1;
    
    //求模板串P的next[]数组的过程，相当于是把P也当成模式 串，两个P进行kmp匹配
    for(int i = 2, j = 0; i <= n; i++)
    {
        while(j && p[i] != p[j + 1])  j = ne[j];
        if(p[i] == p[j + 1])  j++;
        ne[i] = j;
    }
        
    //kmp匹配过程
    for(int i = 1, j = 0; i <= m; i++)  //每次是s[i]和p[j+1]匹配
    {
        while(j && s[i] != p[j + 1])  j = ne[j];
        if(s[i] == p[j + 1])  j++;
        if(j == n)
        {
            //匹配成功
            printf("%d ", i - n);  //输出模板串P在模式串S中出现的位置的起始下标
            j = ne[j];
        }
    }
    
    return 0;
}