引入问题:给定一个对角线非零的上三角矩阵\(M\),求\(M^k\),满足\(M\)的阶\(\le 500\)\(k\le 10^9\)

对998244353取模。

一个显而易见的算法是矩阵快速幂,然而是\(O(N^3\log k)\)的,无法通过本题。

一开始我想,既然是上三角矩阵,那么特征多项式一定不难求,那么是用CH定理+FFT多项式取模啥搞搞?

然而我naive了。

这题我们可以把\(M\)特征值分解为\(Q^{-1}AQ\)形式,其中\(A\)是一个对角矩阵。

那么\(M^k=(Q^{-1}AQ)^k=Q^{-1}A^kQ\)

对一个对角矩阵进行幂的复杂度是\(N\log C\)的,矩阵乘法的复杂度是\(O(N^3)\)的,对一个上三角矩阵进行特征值分解可以使用高斯消元,时间复杂度也是\(O(N^3)\),具体怎么对上三角矩阵进行特征值分解??我tm怎么知道,这个得好好研究一下

upd

自己手推没推出来。观察了下std,手跑了下样例,得出来一些性质。

矩阵\(Q^{-1}\)的第\(i\)列,即为矩阵\(M\)对应第\(i\)行第\(i\)列特征值的特征向量。

这个性质通过特征值分解那套理论也不难得到–因为特征向量是\(M\)所对应“方向不变”的向量,而\(Q\)\(Q^{-1}\)就是在这些旋转方向上的向量,通过线性变换把它们旋转过去//线代那套理论太玄学

std里在\(Q^{-1}\)上递推的,没有看得非常透彻(不过大致也观察出了一些什么),目前已经观察得比较透彻了。

求出\(Q^{-1}\)后直接上矩阵求逆板子求\(Q\),然后直接矩阵乘法就行了。

代码如下:

#include <cstdio>
using namespace std;

const int p = 998244353;

int n, k, a[500][500], l[500][500], r[500][500], v[500];

int qpow(int x, int y)
{
	int res = 1;
	for (x %= p; y > 0; y >>= 1, x = x * (long long)x % p)
		if (y & 1) res = res * (long long)x % p;
	return res;
}

int main()
{
	scanf("%d%d", &n, &k);
	for (int i = 0; i < n; i++)
		for (int j = 0; j < n; j++)
			scanf("%d", &a[i][j]);
	
	//求l
	for (int i = 0; i < n; i++) //枚举l矩阵的第i列,为a矩阵对应于aii的特征向量
	{
		l[i][i] = 1; //钦定的
		for (int j = i - 1; j >= 0; j--) //求这个特征向量的第j行的值
		{
			int sum = 0; //这里需要满足的是\sum_{k=0}^{n-1}a_{j,k}*l{k,i}=0,此时求值为$b_{ji}$
			for (int k = j + 1; k <= i; k++)
				sum = (sum + a[j][k] * (long long)l[k][i]) % p;
			l[j][i] = sum * (long long)qpow((a[i][i] - a[j][j] + p) % p, p - 2) % p;
			//注意这里是a[i][i] - a[j][j], 相当于乘了个-1,就是我们要求的值了
		}
	}
	
	//求l的逆矩阵r,注意到l是上三角矩阵
	for (int i = n - 1; i >= 0; i--)
	{
		r[i][i] = qpow(l[i][i], p - 2);
		for (int j = 0; j < i; j++)
		{
			int e = l[j][i] * (long long)qpow(l[j][j], p - 2) % p;
			for (int k = i; k < n; k++)
				r[j][k] = ((r[j][k] - r[i][k] * (long long)e % p) % p + p) % p;
		}
	}
	
	//收集答案
	for (int i = 0; i < n; i++) v[i] = qpow(a[i][i], k);
	
	long long ans1 = 0, ans2 = 0;
	
	for (int i = 0; i < n; i++)
		for (int j = i; j < n; j++)
		{
			int sb = 0;
			for (int k = i; k <= j; k++)
				sb = (sb + l[i][k] * (long long)v[k] % p * r[k][j] % p) % p;
			ans1 += sb, ans2 ^= sb;
		}
	printf("%lld %lld\n", ans1, ans2);
	return 0;
}

以后再研究下一般矩阵的特征值分解,就可以弄图片压缩啥的了。

这个代码常数略大,本来可以弄小一点的

把最后收集答案时候先让对角矩阵和l乘一下再收集、以及优化一下(x%p+p)%p那部分即可。

版权声明:本文为oier原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://www.cnblogs.com/oier/p/10291286.html