组合数公式专题

如何求组合数$C_a^b$

一、预处理法一

例题：https://www.acwing.com/problem/content/887/

理论依据：$\huge C_a^b=C_{a-1}^b+C_{a-1}^{b-1}$
适合场景：
1、$\large a<=2000,b<=2000$
2、询问次数：$\large n<=1e5$

我们有$a$个苹果，现在需要选出$b$个苹果。一共有多少种选法呢？
我们走到第一个苹果面前，我们面临两个选择：
（1)选择它（2）放弃它

如果选择了它，将要面对$a-1$个苹果中选$b-1$个苹果的问题。

如果放弃它，将要面对$a-1$个苹果中选$b$个苹果的问题。

根据加法原理，两种选择方法加在一起，就是方法总数，就是这面的递推式。

#include <bits/stdc++.h>

using namespace std;
const int N = 2010;         //题目数据上限是2000，这里加了10
const int MOD = 1e9 + 7;    //取模的质数
int c[N][N];                //结果数组

//排列组合 C(A,B)=C(A-1,B)+C(A-1,B-1)
void init() {
    for (int i = 0; i < N; i++)//每个数都来计算
        for (int j = 0; j <= i; j++)//j需要比i小~
            //特判，从i个苹果里选择0个苹果，只有一种方案，就是，啥也不选。
            if (!j)c[i][j] = 1;
            else c[i][j] = (c[i - 1][j] + c[i - 1][j - 1]) % MOD;
}

int n;

int main() {
    //优化输入
    ios::sync_with_stdio(false);
    //预处理出来，以后省的再次算了，费一把劲
    init();
    cin >> n;
    //n组询问
    while (n--) {
        int a, b;
        cin >> a >> b;
        printf("%d\n", c[a][b]);
    }
    return 0;
}

二、预处理法二

例题：https://www.acwing.com/problem/content/888/
上一个办法是把$C_a^b$的值预处理出来了。用的是$c[N][N]$,$N$最大$2010$.
本题的$a$,$b$都是上限$10^5$,如果按上题来，就是$c[10^5][10^5]$,
直接报 $Memory\ Limit\ Exceeded$. 所以不能直接递推求出所有解。

适合场景：
1、$a<=1e5,b<=1e5$
2、询问次数:$\large n<=1e5$

理论依据：$\huge C_a^b=\frac{a!}{(a-b)! * b!}$

举个栗子：
$C_3^2=\frac{3 \times 2}{2 \times 1}=3$

(1) 本题由于怕数据太大，要求结果 $mod\ (1e9+7)$,这个 $MOD=1e9+7$是质数，质数可以直接使用费马小定理+快速幂求逆元。

(2) 现在要求计算出 $a!$, ${b!}^{-1}$,还有 ${(a-b)!}^{-1}$，使用两个数组来装(递推)：

$fact[i] = i!\ \% \ (1e9+7)$

$infact[i] = (i!)^{-1}\ \% \ (1e9+7)$

所以： $C_a^b=\frac{a!}{(a-b)! * b!} = (fact[a] * infact[a-b] * infact[b] )\ \% \ (1e9+7)$

有两个问题需要突破:

1、需要计算$a-b$和$b$ 在模 $1e9+7$ 这个乘法世界的逆元

由于$1e9+7$是质数，可以利用费马小定理+快速幂来计算逆元。

2、需要计算$fact[a]$,即求阶乘

求阶乘，我们可以在初始化时，从小到大，一路走来一路乘，就可以得到$a$的$fact[a]$的值，即阶乘。只要初始时$fact[0]=1$即可,就是零的阶乘是$1$.

C++ 代码

#include <bits/stdc++.h>

using namespace std;
typedef long long LL;
const int N = 100010;       //数据上限
const int MOD = 1e9 + 7;    //模值

int fact[N];    //用来保存阶乘的值
int infact[N];  //用来保存阶乘逆元的值

//快速幂模板
int qmi(int a, int k, int p) {
    int res = 1;
    while (k) {
        if (k & 1) res = (LL) res * a % p;
        a = (LL) a * a % p;
        k >>= 1;
    }
    return res;
}

int main() {
    //优化输入
    ios::sync_with_stdio(false);

    fact[0] = 1;    // 0的阶乘是1,这是人为的规定。
    infact[0] = 1;  // 1/1也是1，infact[0]也是1

    //对于每一个数字n进行计算
    for (int i = 1; i < N; i++) {
        // 根据定义求阶乘,注意一路要进行MOD运算，防止爆掉
        fact[i] = (LL) fact[i - 1] * i % MOD; //强制转为LL是为了防止越界
        // 费马小定理求i逆元
        infact[i] = (LL) infact[i - 1] * qmi(i, MOD - 2, MOD) % MOD;
    }
    int n;
    cin >> n;
    while (n--) {
        int a, b;
        cin >> a >> b;
        //公式C(a,b)=a!/(b!*(a-b)!)
        printf("%d\n", (LL) fact[a] * infact[b] % MOD * infact[a - b] % MOD);
    }
    return 0;
}

三、$Lucas$公式

例题：https://www.acwing.com/problem/content/889/

1.$Lucas$公式:

$\Huge C_a^b \equiv C_{a\%p}^{b\%p} * C_{\frac{a}{p}}^{\frac{b}{p}} (mod \ p)$

适用场景：
数据范围：$b<=a<=1e18$,$p<=1e5$,$p \in prime$,$n<=20$

预处理出 $1…p$ 的阶乘和阶乘的逆元，用卢卡斯定理进行回答。

注意：这个$p$是小于$1e5$的，看到要求模$1e9+7$绕行啊！！！不是干哪个的啊！！！适合$a,b$很大，$p$很小的场景啊！！！

2.如何求解$C_a^b$

$C_a^b=\frac{a!}{(a-b)! \times b!}=\frac{a \times (a-1) \times (a-2) \times …\times(a-b+1) \times (a-b) \times … \times 1}{(a-b) \times (a-b-1) \times … \times 1 \times b!}= \frac{a \times (a-1) \times (a-2) \times …(a-b+1)}{b!}=\frac{a \times (a-1) \times (a-2) \times …(a-b+1)}{b \times (b-1) \times (b-2) \times … \times 2 \times 1}$

根据这个结论，对于$a$来讲，需要变量$j$从$a$一直遍历到$a-b+1$。对于$b$来讲，需要变量$i$从$1$一起遍历到$b$。而且$a$到$a-b+1$其实就是$b$次，比如$10$遍历到$8$，就是$10,9,8$三次，即$b=3$,也就是$10-3+1=8$。
而$i$也是遍历$b$次，真有太有意思了，它们两个可以在一个$b$次的循环中一起变动！

int C(int a, int b, int p) {
    int res = 1;
    for (int i = 1, j = a; i <= b; i++, j--) { 
        //从a到a-b+1是b次，而1-b也是b次，放到一个循环里就行。只不过一个在长大，另一个在减小，这就是上面推导的公式。
        res = (LL) res * j % p;                // a* (a-1) *(a-2)*....*(a-b+1)
        res = (LL) res * qmi(i, p - 2, p) % p; //每次乘i的逆元，而且p是质数，所以可以用费马小定理快速求逆元
    }
    return res;
}

3.C++ 代码

#include <bits/stdc++.h>

using namespace std;
typedef long long LL;

/**
 * 功能：快速幂模板
 * @param a
 * @param k
 * @param p
 * @return
 */
int qmi(int a, int k, int p) {
    int res = 1;
    while (k) {
        if (k & 1) res = (LL) res * a % p;
        a = (LL) a * a % p;
        k >>= 1;
    }
    return res;
}

/**
 * 功能：组合数模板
 * @param a 在a个数中
 * @param b 取b个数
 * @param p 一个质数，用来取模
 * @return 多少种办法
 */
int C(int a, int b, int p) {
    int res = 1;
    for (int i = 1, j = a; i <= b; i++, j--) { 
        //从a到a-b+1是b次，而1-b也是b次，放到一个循环里就行。只不过一个在长大，另一个在减小，这就是上面推导的公式。
        res = (LL) res * j % p;                // a* (a-1) *(a-2)*....*(a-b+1)
        res = (LL) res * qmi(i, p - 2, p) % p; //每次乘i的逆元，而且p是质数，所以可以用费马小定理快速求逆元
    }
    return res;
}

/**
 * 功能：Lucas公式模板
 * @param a
 * @param b
 * @param p
 * @return
 */
int lucas(LL a, LL b, int p) {
    if (a < p && b < p) return C(a, b, p);
    return (LL) C(a % p, b % p, p) * lucas(a / p, b / p, p) % p; //套用公式，还有个递归
}

int n, p;

int main() {
    cin >> n;
    //n组询问
    while (n--) {
        LL a, b;
        cin >> a >> b >> p;
        //利用lucas公式计算组合数
        cout << lucas(a, b, p) << endl;
    }
    return 0;
}

四、不让取模怎么办

https://www.acwing.com/problem/content/890/

1、与前三道题的区别

不再是数据上限的问题了，而是一直不$mod$,有多大都保留，这无疑可能会爆$long\ long$,需要使用高精度。

2、公式一【从定义出发的组合数公式】：

(1) $\large C_a^b=\frac{a \times (a-1) \times … \times(a-b+1)}{b\times (b-1) \times … \times 1}=\frac{a \times (a-1) \times … \times (a-b+1) \times (a-b)!}{ b \times (b-1) \times … \times 1 \times (a-b)!} =\frac{a!}{b! \times (a-b)!}$

3、是不是我们利用高精度+上面的组合数公式直接算就行了？

不是的，因为$yxc$(大雪菜老师)说，这样的效率太低，不可以，需要再想一个好办法。

4、公式二【算术基本定理】

算术基本定理:$\large C_a^b=p_1^{\alpha1} \times p_2^{\alpha2} \times p_3^{\alpha3} … \times p_k^{\alpha k}$
其中$p_1$,$p_2$…是质数，$\alpha 1$,$\alpha 2$,…是指质数$p_1$,$p_2$,…的个数。如果能分解质因数成功的话，那么就可以通过高精度乘法解决掉这个问题。

(1) 那么$p_1$和$p_2$这些东东怎么求？
思路：因为$a,b$都是在$[1,5000]$之间的数，所以可以通过筛质数的方法，提前获取到一个质数数组，然后逐个去看，是不是含有这个质数。就能知道有哪些$p_1,p_2,…$了。

(2) $\alpha 1$,$\alpha 2$又该怎么求呢？
思路：求质数$p$在$a!$中出现的次数办法：
$\huge cnt=\lfloor \frac{a}{p} \rfloor + \lfloor \frac{a}{p^2} \rfloor + \lfloor \frac{a}{p^3} \rfloor + …+ \lfloor \frac{a}{p^k} \rfloor$

参考资料：https://blog.csdn.net/spidy_harker/article/details/88414504

计算$n$的阶乘中质数$p$的个数：

int get(int n, int p) {
    int res = 0;
    while (n) {
        res += n / p;
        n /= p;
    }
    return res;
}

举个栗子：

$ 5!=1 \times 2 \times 3 \times 4 \times 5$,求$2$的个数，
则$1 \sim 5$之间含$2$的个数就是 $\lfloor \frac{5}{2} \rfloor$,就是$2$个。
则$1 \sim 5$之间含$2^2$的个数就是 $\lfloor \frac{5}{2^2} \rfloor$,就是$1$个。
$2^3$就大于$5$，就不再继续。那么一共的个数就是$2+1=3$个。表示在 $5!$这个数字中，存在$3$个$2$，就是$2$中有$1$个$2$，$4$中有两个$2$。

5、算法流程

(1)、筛素数，把$1-5000$之间的素数筛出来。
(2)、计算$C_a^b$中每个已求得素数的个数。
(3)、利用高精度，计算$C_a^b$$=p_1^{\alpha1} \times p_2^{\alpha2} \times p_3^{\alpha3} … \times p_k^{\alpha k}$的值。

6、C++代码

#include <bits/stdc++.h>

using namespace std;
const int N = 5010;

int sum[N]; //每一个质数的次数

int primes[N], cnt;
bool st[N];

//欧拉筛
void get_primes(int n) {
    for (int i = 2; i <= n; i++) {
        if (!st[i]) primes[cnt++] = i;
        for (int j = 0; primes[j] <= n / i; j++) {
            st[primes[j] * i] = true;
            if (i % primes[j] == 0) break;
        }
    }
}

//高精度乘法
vector<int> mul(vector<int> a, int b) {
    vector<int> c;
    int t = 0;
    for (int i = 0; i < a.size(); i++) {
        t += a[i] * b;
        c.push_back(t % 10);
        t /= 10;
    }
    while (t) {
        c.push_back(t % 10);
        t /= 10;
    }
    return c;
}

/**
 * 功能：n的阶乘中包含的质因子p的个数
 * @param n n的阶乘
 * @param p 质因子p
 * @return 有多少个
 * 参考资料：https://blog.csdn.net/spidy_harker/article/details/88414504
 */
int get(int n, int p) {
    int ans = 0;
    while (n) { //p^1的个数，p^2的个数,p^3的个数...
        ans += n / p;
        n /= p;
    }
    return ans;
}

int main() {
    //优化输入
    ios::sync_with_stdio(false);

    int a, b;
    cin >> a >> b;

    //筛2-5000之间质数
    get_primes(5000);

    //遍历每一个质数,求每个质数的次数
    for (int i = 0; i < cnt; i++) {
        int p = primes[i]; //当前质数
        //a!中有多少个质数因子p
        //减去(a-b)!的多少个质数因子p,
        //再减去b!的质数因子p的个数，就是总个数
        //sum[i]记录了每一个质数因子出现的次数
        sum[i] = get(a, p) - get(a - b, p) - get(b, p);
    }

    //利用高精度，把质数因子乘到一起，就是结果了
    vector<int> res;
    res.push_back(1);

    for (int i = 0; i < cnt; i++)        //遍历每一个质数因子
        for (int j = 0; j < sum[i]; j++) //开始乘以它的个数
            res = mul(res, primes[i]);

    //输出答案
    for (int i = res.size() - 1; i >= 0; i--) printf("%d", res[i]);
    return 0;
}

7、这段代码如何理解？

 sum[i] = get(a, p) - get(a - b, p) - get(b, p);

看公式一：
$C_a^b=\frac{a \times (a-1) \times … \times(a-b+1)}{b\times (b-1) \times … \times 1}$ $=\frac{a \times (a-1) \times … \times (a-b+1) \times (a-b)!}{ b \times (b-1) \times … \times 1 \times (a-b)!}$ $=\frac{a!}{b! \times (a-b)!}$
$a!$中质数$p$的个数，减去$b!$中质数$p$的个数，再减去$(a-b)!$中质数$p$的个数，就是公因子消掉的意思。

本文链接：https://www.cnblogs.com/littlehb/p/15010406.html

组合数公式专题

如何求组合数\(C_a^b\)