可持久化线段树

文章	评论	标签
117	17	28

主席树

主席树，又叫可持久化权值线段树，也叫函数式线段树，是可持久化线段树的子集。在本文中，我们可以认为主席树等于可持久化线段树

可持久化线段树简介

基本结构、特点、作用在这篇文章中已经提到过：线段树扩展：权值线段树

总的来说就是每次修改或插入一个值，就新建一个根节点，并且向下递归去新建其他节点。

优点解释

每次插入操作最多创建的节点数都为$\log n$（从根到叶子），一共执行了$n$次插入操作，可持久化线段树的节点总数为$n \log n$，而$n$棵单独的线段树的总节点数是$n^2$，很明显，可持久化线段树通过重用减少了很多节点。同时，可以查询每个历史版本，查询每个历史版本，查询插入第$3$个元素后的线段树，只需要找到第$3$棵树的树根即可。

可持久化线段树基本操作

数据离散化

因为权值线段树的节点范围是一个值域，因此在值域非常大的时候需要进行离散化处理。

离散化过程很简单，先将a[]中的元素复制一份到$b[]$，再将$b[]$中所有数字排序（$sort$），去重（$unique$），最后使用lower_bound()将原序列转换为去重后序列的下标即可。

建立

创建可持久化线段树的过程，相当于把$a[]$中的每个元素都离散化为下标，将该下标插入主席树中。

for(int i=1;i<=n;i++)
{
    update(rt[i],rt[i-1],1,tot,lower_bound(b+1,b+tot+1,a[i])-b);
}

这里的$update$函数是插入函数，具体操作在下一板块，先了解一下每个参数所表示的意思。其中$rt[i]$表示当前版本（第$i$棵树）的树根，$rt[i-1]$为前一版本（第$i-1$棵树）的树根，$tot$为离散化后的元素个数，lower_bound(b+1,b+tot+1,a[i])-b是将$a[i]$离散化后的下标。

因为这里我们用了前缀和的思想，所以$tr[0]$是一棵空树，所以我们可以不去建树。

插入操作

简单叙述

插入元素时，只需要创建更新的节点，对无须更新的节点重用上一个版本（注意：不可对历史版本进行修改）。

例如，原序列$a[]=\{12,5,15,8,12,20,12,15\}$，利用插入操作创建主席树，排序去重后，$b[]=\{5,8,12,15,20\}$，元素个数$tot=5$。原序列$a[]$的第$1$个元素为$12$，对应的$b[]$的下标为$3$；第$2$个元素为$5$，对应的下标为$1$，以此类推。最终离散化后的原序列对应的$b[]$的下标序列为$\{3,1,4,2,3,5,3,4\}$，将该序列插入主席树中。

具体过程

插入元素$3$。复制上一版本$rt[1]=rt[0]$，树根区间为$[1,5]$，权值加$1$，$mid=\frac{1+5}{2}=3$，这里$mid \le 3$，将其插入左子树中；复制上一个版本的节点$[1,3]$，权值加$1$，$mid= \frac{1+3}{2} = 2$，这里$mid<3$，将其加入左子树中，复制上一个版本的节点$[1,2]$，权值加$1$。此时已经加到了叶子节点，处理完毕。
插入元素$1$。复制上一版本$rt[2]=rt[1]$，权值加$1$，$mid= \frac{1+5}{2} = 3$，这里$1 \le mid$，将其插入左子树；复制上一版本的节点$[1,3]$，权值加$1$，$mid= \frac{1+3}{2}=1$，$1 \le mid$，将其插入左子树；复制上一版本的节点$[1,2]$，权值加$1$，$mid= \frac{1+2}{2}=1$，$1 \le mid$，将其插入左子树；复制上次版本的节点$[1,1]$，权值加$1$.此时已经加到了叶子节点，处理完毕。

void update(int &i,int j,int l,int r,int k)
{
    i=++cnt;
    tree[i]=tree[j];
    tree[i].num++;
    if(l==r)
        return;
    int mid=(l+r)>>1;
    if(k<=mid)
        update(tree[i].lc,tree[j].lc,l,mid,k);
    else
        update(tree[i].rc,tree[j].rc,mid+1,r,k);
    return;
}

其中$i$表示当前版本的父亲节点，$j$表示上一版本的父亲节点，$l$表示当前区间左端点，$r$表示当前区间右端点，$k$表示要插入的值。

可持久化线段树应用

求区间第$k$小的数

原理

在可持久化线段树中，有相同值域的节点有可减性。

以$rt[i-1]$为根的线段树，其权值表示序列$[1,i-1]$有有多少个数落入了$[l,r]$区间。
以$rt[j]$为根的线段树，其权值表示序列$[1,j]$有多少个数落入了$[l,r]$区间。

两棵线段树的值域划分是相同的，即两棵线段树中的节点是一一对应的。有相同值域的节点有可减性。$rt[j]$的权值减去$rt[i]$的权值等于序列$[i,j]$有多少个数落入值域$[l,r]$区间。

查询[i,j]区间第k小元素的时候，只需要将$rt[j]$和$rt[i-1]$两棵线段树的权值相减，就可以得到一棵$[i,j]$区间对应的线段树，然后在该线段树上搜索即可。

步骤

当我要查询区间$[i,j]$的第$k$小的数，从树根$rt[j]$和$rt[i-1]$开始，若l==r，则返回$k$；将当前两个节点的左子树权值相减得到$s$，如果$k \le s$，则在左子树中查找第$k$小，否则在右子树中查找第$k-s$小。

int search(int i,int j,int l,int r,int k)
{
    if(l==r)
        return l;
    int s=tree[tree[j].lc].num-tree[tree[i].lc].num;
    int mid=(l+r)>>1;
    if(k<=s)
        return search(tree[i].lc,tree[j].lc,l,mid,k);
    else
        return search(tree[i].rc,tree[j].rc,mid+1,r,k-s);
}

分析

区间查询从根节点到叶子节点最多查询$\log n$个节点，时间复杂度为$O(\log n)$，$m$次查询的总时间复杂度为$O(m \log n)$，插入$1$个数需要$O(\log n)$的时间复杂度，插入$n$个数需要$O(n \log n)$的时间复杂度，所以使用主席树求静态区间第$k$小的数总复杂度为$O((n+m)\log n)$。

而线段树套平衡树可以在$O((n+m) \log^2 n)$的时间复杂度内完成这项任务，但它的时间复杂度不如主席树。但是主席树很难用于动态修改，而线段树套平衡树可以。

代码

来源：洛谷：P3834 【模板】可持久化线段树 2

#include<iostream>
#include<cstdio>
#include<algorithm>
#include<cstring>
#include<cmath>
#include<vector>
#include<queue>
#include<map>
#include<set>
using namespace std;
#define LL long long
#define uLL unsigned long long
#define reg register
#define PI acos(-1.0)
#define pb(x) push_back(x)
#define mp(a,b) make_pair(a,b)
#define fi first
#define se second
#define pr(x) cerr<<#x<<"="<<(x)<<endl
#define pri(x,lo) {cerr<<#x<<"={";for (int ol=0;ol<=lo;ol++)cerr<<x[ol]<<",";cerr<<"}"<<endl;}
#define inf 100000000
#define N 1000
#define M 10000001
template<class T>inline void read(T &x)
{
    x=0;register char c=getchar();register bool f=0;
    while(!isdigit(c))f^=c=='-',c=getchar();
    while(isdigit(c))x=(x<<3)+(x<<1)+(c^48),c=getchar();
    if(f)x=-x;
}
template<class T>inline void print(T x)
{
    if(x<0)putchar('-'),x=-x;
    if(x>9)print(x/10);
    putchar('0'+x%10);
}
struct Node
{
    int lc,rc,num;
}tree[M];
int a[M],b[M],rt[M],n,m,cnt;
void update(int &i,int j,int l,int r,int k)
{
    i=++cnt;
    tree[i]=tree[j];
    tree[i].num++;
    if(l==r)
        return;
    int mid=(l+r)>>1;
    if(k<=mid)
        update(tree[i].lc,tree[j].lc,l,mid,k);
    else
        update(tree[i].rc,tree[j].rc,mid+1,r,k);
    return;
}
int search(int i,int j,int l,int r,int k)
{
    if(l==r)
        return l;
    int s=tree[tree[j].lc].num-tree[tree[i].lc].num;
    int mid=(l+r)>>1;
    if(k<=s)
        return search(tree[i].lc,tree[j].lc,l,mid,k);
    else
        return search(tree[i].rc,tree[j].rc,mid+1,r,k-s);
}
int main()
{
    read(n),read(m);
    for(int i=1;i<=n;i++)
    {
        read(a[i]);
        b[i]=a[i];
    }
    sort(b+1,b+1+n);
    int tot=unique(b+1,b+1+n)-b-1;
    for(int i=1;i<=n;i++)
    {
        update(rt[i],rt[i-1],1,tot,lower_bound(b+1,b+tot+1,a[i])-b);
    }
    for(int i=0;i<=n;i++)
    {
        pr(rt[i]);
    }
    for(int i=1;i<=m;i++)
    {
        int l,r,k;
        read(l),read(r),read(k);
        int ans=search(rt[l-1],rt[r],1,tot,k);
        print(b[ans]);
        putchar('\n');
    }
    return 0;
}

laoguanTX