谈一类神奇的数据结构—

猫树是一个有趣的数据结构，之前一直觉得这玩意儿应该很玄学，但学了之后发现还是挺朴素也挺好打的数据结构

→o→去我洛谷博客看呗？

一、猫树的作用

学一个算法当然得先了解它的用处，那么猫树的作用嘛…

简单来讲，线段树能维护的信息猫树基本都能维护

比如什么区间和、区间 gcd 、最大子段和等 满足结合律且支持快速合并的信息

二、猫树的算法实现

什么都别说，我知道你想先知道猫树是怎么实现的

我们就以区间和查询为例，假设当前查询的区间为 $[~l~,~r~]$

那么如果我们在此之前预处理过某两个区间的信息，且这两个区间可以合并成当前查询区间，是不是就可以 $O(1)$ 得到答案了呢？

但是问题就在于如何在一个较短的时间内预处理区间信息，并且使得任意一个区间都能被分成两份预处理过的区间

不扯了，进入正题

1.首先将 1~n 整个区间分成两份 1~mid ， mid+1~n

2.然后对于这两个区间，我们先从中间点 mid 和 mid+1 出发，$O(n)$ 地向两边遍历区间中的每个元素，同时维护要处理的信息

FAQ:怎么维护？

这得看你要维护的信息，比如我们举例是区间和，那么处理方式如下：

对于左边的区间，i 倒序遍历， $f[i]=f[i+1]+a[i]$

对于右边的区间，i 正序遍历， $f[i]=f[i-1]+a[i]$

3.等两个区间都处理完之后，我们再将两个区间继续分下去，重复迭代以上步骤直到区间左右边界重合（即 $l~=~r~$）

接着我们考虑到这样的迭代总共会有 $log~ n$ 层，一个数都会在每一层中都被计算到一次，也就是说时间复杂度是 $n~ log~ n$ 的，虽然比不上线段树预处理的线性复杂度，但也已经能够让人接受了

至于空间方面，我们考虑向下迭代的长度相同的区间两两不相交，那么他们其实可以存在同一维数组里面，也就是说我们的空间复杂度也是 $n~ log~ n $ 的，在承受范围之内

但是这里还有一个问题：如何保证每个区间都能被分成两份预处理过的区间？

其实我们看到上面的处理方法使得

某个预处理过的区间可以将任意一个左右端点都在该区间内，且经过该区间中点的区间分成两份，而这两份区间已经处理过了，那么就可以 $O(1)$ 合并求解了

可能你已经玄学理解了，但是用图还是证明一下好了

Proof：

还是画图好…下面是一个不断向下迭代的区间

我们先将查询区间的两个端点表示在总区间上

我们发现这两个点并不能被当前所在区间的中间点分到两边，于是我们将他们下移，那么这两个点就一起进入了右区间

我们发现还是他们还是不能被中间点分成两份，继续下移，一起进入左区间

可以被分成两份了，那么我们就成功地将该询问区间分成了两个已处理的区间

根本原因我已经在上面加粗了，没错，就是一起，如果两个点无法被当前所处区间分到中间点的两边，那么他们必然在该区间的左半部分或者右半部分，那么就可以同时进入某一边的区间了

于是乎得证了…

三、猫树的复杂度分析

然后，算法的复杂度总得分析的吧…

预处理复杂度

其实这个东西上面讲过了，就是 $O(n log~ n)$ ，漏看的同学可以翻回去了

询问复杂度

我们发现上面的预处理方式已经满足了我们分割区间的要求，但是…

FAQ:按照上面的找寻分割点的方法，我们发现复杂度好像是 $O(log~ n)$的？（这不还是线段树的复杂度？）

别急，上面只是证明分割的可行性，并不是找寻分割点的方法

其实不难看出，如果我们让两个点从叶子结点出发，不断向上走知道相遇，那么该区间的中间点就是它们的分割点。

emmm…两个节点不断向上走？这不是 $LCA$ 嘛！那我们就用倍增或者树剖来找$LCA$ ？

然后我们会发现查询复杂度神奇地变成了 $O(log~log~n)$，已经比线段树强了哈？

还不够优秀？对，还可以继续优化

之前我们有提到分割点在 $LCA$ 上，那我们可以 $O(1)$ 得到两个节点的 $LCA$ 么？ST表？貌似是可以的哦，但其实不用这么麻烦

我们观察一下就可以发现（或者说根据线段树的性质来说），两个叶子结点的 $LCA$ 的节点编号其实就是他们编号的最长公共前缀（二进制下）

Eg：

编号为 $(10001)_2 $ 和 $(10110)_2$ 的两个节点的 $LCA$ 编号就是 $(10)_2$

那么怎么快速求出两个数的最长公共前缀？

这里要用到非常妙的一个办法：

我们将两个数异或之后可以发现他们的公共前缀不见了，即最高位的位置后移了 $\log LCA.len$ ，其中 $LCA.len$ 表示 $LCA$ 节点在二进制下的长度

那么我们就可以预处理一下 log 数组，然后在询问的时候就可以快速求出两个询问节点的 $LCA$ 所在的层了

等等，层？不用求出编号的么？

那么上面又说过的啊…我们将长度相同的区间放在一维数组里了啊，那么我们又知道这两个区间的左右边界，中间点又是确定的，当然可以在该层中得到我们想要的信息并快速合并起来了（这个的话还是得看代码理解的吧？）

综上所述，我们可以在 O(1) 的时间复杂度内查询区间

这复杂度比起线段树都差一个 $log$ 了，一般来讲就是十几倍的时间，然鹅自己造了数据测了测发现两者运行时间仅为两三倍，究其原因的话还是普通线段树的 $log$ 基本是跑不满的（换句话说，我数据造太烂了…）

修改复杂度

修改？猫树一般不拿来修改！

而且也有大佬向我提议说修改没什么用，但我觉得还是讲讲（限制过大，仅供娱乐）

举个例子：有些题目比较毒瘤，可能会给你的操作中大多是查询，少数是单点修改

那么完蛋了，猫树能支持修改么？果断弃坑

其实…猫树可以支持吧…

我们在处理的时候用的是一个类似于前缀和的做法，那么前缀和修改的复杂度是多少？（好吧一般来讲带修改就不用前缀和了，这里只是举个例子）， $O(n)$ ！

那么我们看看一个数在长度为 n/2 、 n/4 、 n/8 …. 1 的区间内被做过前缀和，那么修改的时候也就是要修改这些区间，然后这些区间长度加起来…就是 n 吧？

然鹅具体的代码实现就不给出了，~~因为我懒~~ 就在这里给个思想，仅供娱乐

但是上面讲的是单点修改，区间修改呢？

这个我真不会，而且也办不到的…讲道理改一次是 $O(n~ log~ n)$ 的吧（相当于重建了），毕竟这也是性质决定的 ~~（区间修改想都别想赶紧弃坑）~~

四、猫树的代码实现

以处理区间最大子段和为例：

//by Judge
#include<cstdio>
#include<iostream>
#define ll long long
using namespace std;
const int M=2e5+3;
#ifndef Judge
#define getchar() (p1==p2&&(p2=(p1=buf)+fread(buf,1,1<<21,stdin),p1==p2)?EOF:*p1++)
#endif
char buf[1<<21],*p1=buf,*p2=buf;
inline int read(){ int x=0,f=1; char c=getchar();
	for(;!isdigit(c);c=getchar()) if(c==\'-\') f=-1;
	for(;isdigit(c);c=getchar()) x=x*10+c-\'0\'; return x*f;
} char sr[1<<21],z[20];int C=-1,Z;
inline void Ot(){fwrite(sr,1,C+1,stdout),C=-1;}
inline void print(int x,char chr=\'\n\'){
    if(C>1<<20)Ot();if(x<0)sr[++C]=45,x=-x;
    while(z[++Z]=x%10+48,x/=10);
    while(sr[++C]=z[Z],--Z);sr[++C]=chr;
} int n,m,a[M],len,lg[M<<2],pos[M],p[21][M],s[21][M];
// p 数组为区间最大子段和， s 数组为包含端点的最大子段和
inline int Max(int a,int b){return a>b?a:b;}
#define ls k<<1
#define rs k<<1|1
#define mid (l+r>>1)
#define lson ls,l,mid
#define rson rs,mid+1,r
void build(int k,int l,int r,int d){ //这里的边界是叶子结点
	//到达叶子后要记录一下 位置 l 对应的叶子结点编号
	if(l==r) return pos[l]=k,void(); int prep,sm;
	// 处理左半部分
	p[d][mid]=s[d][mid]=prep=sm=a[mid],sm=Max(sm,0);
	for(int i=mid-1;i>=l;--i)
		prep+=a[i],sm+=a[i],s[d][i]=Max(s[d][i+1],prep),
		p[d][i]=Max(p[d][i+1],sm),sm=Max(sm,0);
	// 处理右半部分
	p[d][mid+1]=s[d][mid+1]=prep=sm=a[mid+1],sm=Max(sm,0);
	for(int i=mid+2;i<=r;++i)
		prep+=a[i],sm+=a[i],s[d][i]=Max(s[d][i-1],prep),
		p[d][i]=Max(p[d][i-1],sm),sm=Max(sm,0);
	build(lson,d+1),build(rson,d+1); //向下递归
}
inline int query(int l,int r){ if(l==r) return a[l];
	int d=lg[pos[l]]-lg[pos[l]^pos[r]];  //得到 lca 所在层
	return Max(Max(p[d][l],p[d][r]),s[d][l]+s[d][r]);
}
int main(){ n=read(),len=2;
	while(len<n) len<<=1;
	for(int i=1;i<=n;++i) a[i]=read();
	for(int i=2,l=len<<1;i<=l;++i)
		lg[i]=lg[i>>1]+1;
	build(1,1,len,1);
	for(int m=read(),l,r;m;--m)
		l=read(),r=read(),
		print(query(l,r));
	return Ot(),0;
}

码量其实会少很多，可以看到最主要的码量就在 $build$ 里面，但是 $build$ 函数的思路还是很清晰的

五、猫树的推荐例题

GSS1

就是上面的板子

GSS5

不带修改好开森，这题要求最大前缀、最大后缀，但是并不影响猫树的发挥

用了猫树之后直接 $0 ms$

FAQ：貌似不用也可以啊…

但是猫树码量小吧…

FAQ：不见得啊….

…

下面是代码

//by Judge
#include<cstdio>
#include<iostream>
#define ll long long
using namespace std;
const int M=2e4+3;
#ifndef Judge
#define getchar() (p1==p2&&(p2=(p1=buf)+fread(buf,1,1<<21,stdin),p1==p2)?EOF:*p1++)
#endif
inline void cmax(int& a,int b){if(a<b)a=b;}
inline void cmin(int& a,int b){if(a>b)a=b;}
char buf[1<<21],*p1=buf,*p2=buf;
inline int read(){ int x=0,f=1; char c=getchar();
    for(;!isdigit(c);c=getchar()) if(c==\'-\') f=-1;
    for(;isdigit(c);c=getchar()) x=x*10+c-\'0\'; return x*f;
} char sr[1<<21],z[20];int C=-1,Z;
inline void Ot(){fwrite(sr,1,C+1,stdout),C=-1;}
inline void print(int x,char chr=\'\n\'){
    if(C>1<<20)Ot();if(x<0)sr[++C]=45,x=-x;
    while(z[++Z]=x%10+48,x/=10);
    while(sr[++C]=z[Z],--Z);sr[++C]=chr;
} int n,m,a[M];
namespace cat_tree{ int len,lg[M<<1],pos[M];
    int p[16][M],s[16][M],f[16][M],g[16][M];
    #define ls k<<1
    #define rs k<<1|1
    #define mid (l+r>>1)
    #define lson ls,l,mid
    #define rson rs,mid+1,r
    inline int Max(int a,int b){return a>b?a:b;}
    inline void init(){ for(len=2;len<n;len<<=1);
        for(int i=1,l=len<<1;i<=l;++i) lg[i]=lg[i>>1]+1;
    }
    void build(int k,int l,int r,int d){
        if(l==r) return pos[l]=k,void(); int prep,sm;
        f[d][mid]=g[d][mid]=p[d][mid]=s[d][mid]=prep=sm=a[mid],sm=Max(sm,0);
        for(int i=mid-1;i>=l;--i)
            prep+=a[i],sm+=a[i],s[d][i]=prep,
            f[d][i]=Max(f[d][i+1],prep),g[d][i]=sm,
            p[d][i]=Max(p[d][i+1],sm),sm=Max(sm,0);
        f[d][mid+1]=g[d][mid+1]=p[d][mid+1]=s[d][mid+1]=prep=sm=a[mid+1],sm=Max(sm,0);
        for(int i=mid+2;i<=r;++i)
            prep+=a[i],sm+=a[i],s[d][i]=prep,
            f[d][i]=Max(f[d][i-1],prep),g[d][i]=sm,
            p[d][i]=Max(p[d][i-1],sm),sm=Max(sm,0);
        build(lson,d+1),build(rson,d+1);
    }
    inline int query_sum(int l,int r){
        if(l>r) return 0;if(l==r) return a[l];
        int d=lg[pos[l]]-lg[pos[l]^pos[r]];
        return s[d][l]+s[d][r];
    }
    inline int query_pre(int l,int r){
        if(l>r) return 0; if(l==r) return a[l];
        int d=lg[pos[l]]-lg[pos[l]^pos[r]];
        return Max(s[d][l]+f[d][r],g[d][l]);
    }
    inline int query_suf(int l,int r){
        if(l>r) return 0; if(l==r) return a[l];
        int d=lg[pos[l]]-lg[pos[l]^pos[r]];
        return Max(g[d][r],f[d][l]+s[d][r]);
    }
    inline int query_mid(int l,int r){
        if(l>r) return 0; if(l==r) return a[l];
        int d=lg[pos[l]]-lg[pos[l]^pos[r]];
        return Max(Max(p[d][l],p[d][r]),f[d][l]+f[d][r]);
    }
} using namespace cat_tree;
inline int query(int l1,int r1,int l2,int r2){ int ans;
    if(r1<l2) return query_sum(r1+1,l2-1)+query_suf(l1,r1)+query_pre(l2,r2);
    ans=l1<l2?Max(query_mid(l2,r1),query_suf(l1,l2)+query_pre(l2,r2)-a[l2]):query_mid(l2,r1);
    if(r2>r1) ans=Max(ans,query_suf(l1,r1)+query_pre(r1,r2)-a[r1]); return ans;
}
int main(){
    for(int T=read();T;--T){ n=read();
        for(int i=1;i<=n;++i) a[i]=read();
        init(),build(1,1,len,1);
        for(int m=read(),l1,r1,l2,r2;m;--m)
            l1=read(),r1=read(),
            l2=read(),r2=read(),
            print(query(l1,r1,l2,r2));
    } return Ot(),0;
}

其他的能拿来当纯模板的基本找不到（可见限制还是蛮大的，毕竟带修改的不行），不过一些要拿线段树来优化的题目（比如线段树优化 dp ）还是可以用上的…吧？

参考资料：%%%zjp大佬

本文链接：https://www.cnblogs.com/Judge/p/10475728.html

谈一类神奇的数据结构——猫树