YA! 烷基计数方法

约 3513 字大约 12 分钟

OI maths chemistry

2025-4-30

YA 是 Yet Another 口牙！

写作风格提示

我希望本文是一篇生动的博客。所以不要被它的长度吓到。本文真的很有趣。
我之所以有时自称“我们”，不是因为想显得专业，也不是因为我是西方的君主，更不是因为我因为泰坦神迹变成了一千个分身，而是因为：我想和读者作为一个共同体，一起把这个问题从零解决掉。

问题

$\mathrm{-C_n H_{2n+1}}$ （ $n$ 烷基）有多少种不同的结构？

状态转移方程

前置知识

在 $n$ 个元素中选取可以重复的 $m$ 个组成可重集，方案数为 $\displaystyle\binom{n+m-1}{m}$

转移方程

递归讨论半键上的碳原子所连的三个烷基，可以得到递归方程：

f(n)=\sum_{\substack{0\le i<j<k \le n-1 \\ i+j+k=n-1}} f(i)f(j)f(k) + \sum_{\substack{0\le i,j,k \le n-1 \\ i=j\ne k \\ i+j+k=n-1}} \binom{f(i)+1}{2} f(k) + \sum_{\substack{0\le i=j=k \le n-1 \\ i+j+k=n-1}} \binom{f(i)+2}{3}

<垃圾话> 化学课一结束，Q 就跟 F 和我分享了他的公式（原始公式不是这样的，这是更简洁优雅的一种表示）。自习课（老师允许我们去打球），我们一拍即合，去小办公室借了电脑，开始写程序验证。验证通过！很显然，根据上面的方程，这个算法是 $O(n^3)$ 的，但我总觉得还有更快的算法。 </垃圾话>

从 O(n^3) 到 O(n^2)

换上下限

~~前面的式子优雅吗？我要开始爆算了。~~
其实是先繁后简的思想啦，爆算完更优雅哦！

注意

为了可读性，在之后的所有求和中，我们都默认 $0\le i,j,k \le n-1, i+j+k=n-1$ .
你可能会看到只有一项的求和。那是为了式子的统一。
为了可读性，求和次序明确时，不加括号。

由对称性以及容斥原理，可得

\begin{aligned} \sum_{i<j<k} f(i)f(j)f(k) &= \frac{1}{6} \sum_{|\{i,j,k\}|=3} f(i)f(j)f(k) \\ &= \frac{1}{6} \left( \sum_{i,j,k}-3\sum_{i=j}+2\sum_{i=j=k} \right) f(i)f(j)f(k) \\ &= \frac{1}{6} \sum_{i,j,k} f(i)f(j)f(k) - \frac{1}{2} \sum_{2i+k=n-1} f(i)^2f(k) + \frac{1}{3} \sum_{3i=n-1} f(i)^3 \end{aligned}

又因为

\begin{aligned} \sum_{i=j\ne k} \binom{f(i)+1}{2} f(k) &= \left( \sum_{i=j}-\sum_{i=j=k} \right) \binom{f(i)+1}{2} f(k) \\ &= \sum_{2i+k=n-1} \binom{f(i)+1}{2} f(k) - \sum_{3i=n-1} \binom{f(i)+1}{2} f(i) \end{aligned}

我们就可以把原式化为

\begin{aligned} f(n) &= \frac{1}{6} \sum_{i,j,k} f(i)f(j)f(k) + \sum_{2i+k=n-1} \left( \binom{f(i)+1}{2} f(k) - \frac{1}{2} f(i)^2f(k) \right) + \sum_{3i=n-1} \left( \frac{1}{3} f(i)^3 + \binom{f(i)+2}{3} - \binom{f(i)+1}{2} f(i) \right) \\ &= \frac{1}{6} \sum_{i,j,k} f(i)f(j)f(k) + \frac{1}{2} \sum_{2i+k=n-1} f(i)f(k) + \frac{1}{3} \sum_{3i=n-1} f(i) \end{aligned}

十分可爱！——Q 如此评价道。

以上也可以用 Polya 定理推导。

分离变量

有了以上的式子，我们就可以分离变量，分散计算了。

\begin{aligned} f(x) &= \frac{1}{6} \sum_{i,j,k} f(i)f(j)f(k) + \frac{1}{2} \sum_{2i+k=n-1} f(i)f(k) + \frac{1}{3} \sum_{3i=n-1} f(i) \\ &= \sum_{0\le k\le n-1} f(k) \left( \frac{1}{6} \left( \sum_{0\le i\le n-1-k}{f(i)f(n-1-k-i)} \right) + \frac{1}{2} f\left(\frac{n-1-k}{2}\right) \right) + \frac{1}{3} f\left( \frac{n-1}{3} \right) \\ & \qquad \text{注：} \forall x\notin\mathbb{N}, f(x) \mathop{=}\limits^\text{def} 0 \\ \end{aligned}

令 $g(n) = \displaystyle \frac{1}{6} \left( \sum_{0\le i\le n}{f(i)f(n-i)} \right) + \frac{1}{2} f\left(\frac{n}{2}\right)$ ，则

f(n) = \sum_{0\le k\le n-1} f(k)g(n-1-k) + \frac{1}{3} f\left( \frac{n-1}{3} \right)

我们容易发现，有两个类似卷积形式的求和，以上公式也可以写成

\begin{aligned} f(n) &= (f*g)(n-1) + \frac{1}{3} f\left(\frac{n-1}{3}\right) \\ g(n) &= \frac{1}{6}(f*f)(n) + \frac{1}{2} f \left(\frac{n}{2}\right) \end{aligned}

注意

此处只是取卷积中的一项，如果使用完整的卷积，虽然有 FFT，但是会造成冗余。

<垃圾话> 看到这个公式，F 就忍不住让我用 FFT 了。我告诉他只是取其中一项，然而他还是坚持自己的直觉。</垃圾话>

或者，我们将 $f, g$ 看成数据结构，则有转移方程

\begin{aligned} & f.\mathrm{append}\left( f \otimes g + \frac{1}{3} f\left(\frac{n-1}{3}\right) \right) \\ & g.\mathrm{append}\left( \frac{1}{6} f \otimes f + \frac{1}{2} f \left(\frac{n}{2}\right) \right) \end{aligned}

其中 $f \otimes g = f \cdot \operatorname{rev}(g)$ .

如果你不想要小数，令 $g'(n) = 6g(n)$ 即可。

\begin{aligned} & f.\mathrm{append}\left( \frac{1}{6} \left( f \otimes g + 2f\left(\frac{n-1}{3}\right)\right) \right) \\ & g.\mathrm{append}\left( f \otimes f + 3 f \left(\frac{n}{2}\right) \right) \end{aligned}

以上的公式形式简洁、计算方便，是手工计算的不二之选。

def rev_prod(l1, l2):
    return sum(a*b for a, b in zip(l1, l2[::-1]))

f = [1]
g = [4]

for i in range(1, 10):
    f.append((rev_prod(f, g) + (f[(i-1)//3]*2 if i%3==1 else 0)) // 6)
    g.append(rev_prod(f, f) + (f[i//2]*3 if i%2==0 else 0))
    print(f'-C{i}H{2*i+1} 共有 {f[i]} 种同分异构体')

从 O(n^2) 到 O(n sqrt(nlogn))

通过上面的化简，我们就可以将问题抽象化，只需要找到一个（一对）支持 $\text{append}$ 和 $\otimes$ 操作的数据结构即可。
那么，我们能否寻找一个更快的数据结构，支持尾插以及 $\otimes$ 运算呢？

DeepSeek 说不行，但是在这件事情上，DeepSeek 甚至没有占卜来得靠谱。当然，我没有占卜过，但是当我看到这个数据结构的时候，冥冥之中总感觉它可以优化到 $O(n\sqrt{n})$ .

所以我偏要去优化。
~~其实这人是受化学老师刺激了。~~

我们的插入是 $O(1)$ 而运算是 $O(n)$ 的。根据此消彼长~~我瞎编的~~原理，我们要给插入操作制造冗余信息，才能用这些信息来优化运算。

是的。我为什么在前面讲了 FFT 呢？就是埋了个伏笔啊！

我们看看 FFT 是如何加速运算的。

注意

之后的推导都是对数据结构抽象的推导，与实际问题不直接相关。

首先我们来解个莫名其妙的不等式： $0 \le i,n-i \le p ~(0 \le p \le n)$ ，
答案很简单，就是 $n-p \le i \le p$ .

接下来我们要干什么呢？让我们把求和分块：

\sum_{i=0}^{n} a(i)b(n-i) = \sum_{i=n-p}^{p} a(i)b(n-i) + \sum_\text{otherwise} a(i)b(n-i)

关注第一个和式，有

\displaystyle\sum_{i=n-p}^{p} a(i)b(n-i) = (a_{0..p} * b_{0..p})(n)

注

根据之前的解不等式，由于 $n-i \le p$ 的限制， $i$ 的下限取不到 $0$ .

显然，可以用 FFT，一次性 $O(p\log p)$ 地把 $(a_{0..p} * b_{0..p})$ 算出来。
剩下的求和，时间复杂度为 $O(n-p)$ .

其实就是类似分块打表的思想。

全部加起来，总时间复杂度为

T(N) = \displaystyle \left(\sum_{n=1}^{N}n-\max_{\substack{p\in P \\ p\le n}} p \right) + \left( \sum_{p\in P} p \log p \right)

~~P 是 Preprocessing 的意思，不是 prime 啊！用质数数列当 p 肯定是不行的啦！~~

所以，我们怎么选择 $p$ 点，使得复杂度最小呢？

一个块长调一天

首先我们用特殊值探个路。

我们设 $p_i = ki$ ，也就是等距取 $p$ .

于是我们有

\begin{aligned} T(N) &= O\left( Nk + \sum_{i=1}^{N/k} ki\log i \right) \\ &= O\left(Nk + \frac{N^2}{k} \log N \right) \\ &\ge O\left(N \sqrt{N \log N} \right) \end{aligned}

当 $k=\sqrt{N \log N}$ 时取等。

当然，由于常数的关系， $\sqrt{N \log N}$ 未必是最佳的块长。不过这不影响它的复杂度。

块长最优性证明

设 $p_i$ 在 $x$ 处的密度为 $\rho(x) \in [0,1]$ ，用相近的方法对以上的求和做积分近似：

\begin{aligned} T(N) &= O\left( \int_1^N \rho(x)x \log x + (1-\rho(x)) \frac{1}{\rho(x)} ~\mathrm{d}x \right) \\ &= O\left( -N + \int_1^N \rho(x)x \log x + \frac{1}{\rho(x)} ~\mathrm{d}x \right) \\ &= O\left( -N + \int_1^N \rho(x)x \log x + \frac{1}{\rho(x)} ~\mathrm{d}x \right) \\ &\ge O\left( -N + \int_1^N \sqrt{x \log x} ~\mathrm{d}x \right) \\ &= O(N \sqrt{N \log N}) \end{aligned}

取等条件是 $\rho(x)=\dfrac{1}{\sqrt{x\log x}}$ ，这喻示着 $p_{i+1} = p_i + C\sqrt{p_i\log_2{p_i}}$ .

但是简单起见，我们仍然使用 $p_i = ki$ ，它的复杂度也是一样的。

<垃圾话>算到这里，我竟激动得无法入眠。不知怎地，天空忽然下起了大雨。我想，那是因为我心中的乌云已经~~被可莉炸掉了~~被彻底扫清了罢。</垃圾话>

核心真伪难辨代码片段

def rev_prod(l1, l2):
    return sum(a*b for a, b in zip(l1, l2[::-1]))


class DataStructure:
    def __init__(self, x, y, k):
        self.a = [x]
        self.b = [y]
        self.k = k
        self.max_idx = 0

        self.p = -1
        self.conv = []

    def add(self, x, y):
        self.a.append(x)
        self.b.append(y)
        self.max_idx += 1

        if self.max_idx % self.k == 0:
            self.p = self.max_idx
            self.conv = conv(self.a, self.b)

    def calc(self):
        if 2*self.p < self.max_idx:
            return rev_prod(self.a, self.b)
        else:
            ans = self.conv[self.max_idx]
            ans += sum(self.a[i]*self.b[self.max_idx-i] 
                       for i in range(self.max_idx-self.p))
            ans += sum(self.a[i]*self.b[self.max_idx-i] 
                       for i in range(self.p+1, self.max_idx+1))
            return ans

关于时间复杂度与优绩主义的桎梏

有人要问了：

对于烷烃计数，已经有 $O(N \log N)$ 的算法了，为什么还要设计一个更慢的算法呢？

是的，这样这样的确算不上什么突破。但是探索的乐趣却是实打实的。
语文期中考，作文主题是“无用之用”。这两件事，或许有异曲同工之妙吧。

取整数的 $\mu = 3$ ，此时和生成函数+牛顿迭代只差一个数量级，机子好一点可以卡过。

附录：题目的 C++ 实现

#include <bits/stdc++.h>
using namespace std;

typedef long long ll;

const ll mod = 998244353, 
      one_sixth = (mod+1) / 6,  // 998244354 % 6 == 0
      maxn = 10e4+100;

template<typename _T>
void fread( _T &x ) {
    x = 0; char s = getchar(); bool f = false;
    while( s < '0' || '9' < s ) { f = s == '-', s = getchar(); }
    while( '0' <= s && s <= '9' ) { x = ( x << 3 ) + ( x << 1 ) + ( s - '0' ), s = getchar(); }
    if( f ) x = -x;
}

template<typename _T>
void fwrite( _T x ) {
    if( x < 0 ) putchar( '-' ), x = -x;
    if( 9 < x ) fwrite( x / 10 );
    putchar( x % 10 + '0' );
}

template<ll Mod, ll G>  // Mod必须为满足NTT条件的质数，G为对应的原根
struct NTT {
    // 快速幂（内部使用，无需暴露）
    static ll _pow(ll a, ll b) {
        ll res = 1;
        while (b) {
            if (b & 1) res = res * a % Mod;
            a = a * a % Mod;
            b >>= 1;
        }
        return res;
    }

    // 位逆序预处理
    static vector<int> _get_rev(int len, int bit) {
        vector<int> rev(len);
        for (int i = 0; i < len; ++i)
            rev[i] = (rev[i >> 1] >> 1) | ((i & 1) << (bit - 1));
        return rev;
    }

    // 核心变换函数（invert=false为正变换，invert=true为逆变换）
    static void _transform(vector<ll>& a, const vector<int>& rev, bool invert) {
        int n = a.size();
        for (int i = 0; i < n; ++i)
            if (i < rev[i]) swap(a[i], a[rev[i]]);

        for (int len = 2; len <= n; len <<= 1) {
            ll wn = _pow(G, (Mod - 1) / len);
            if (invert) wn = _pow(wn, Mod - 2);
            
            for (int i = 0; i < n; i += len) {
                ll w = 1;
                for (int j = 0; j < len/2; ++j) {
                    ll u = a[i + j], v = a[i + j + len/2] * w % Mod;
                    a[i + j] = (u + v) % Mod;
                    a[i + j + len/2] = (u - v + Mod) % Mod;
                    w = w * wn % Mod;
                }
            }
        }

        if (invert) {
            ll inv_n = _pow(n, Mod - 2);
            for (ll& x : a) x = x * inv_n % Mod;
        }
    }

    // 卷积入口函数
    static vector<ll> convolve(vector<ll> a, vector<ll> b) {
        int n = a.size(), m = b.size();
        if (n == 0 || m == 0) return {};

        int len = 1, bit = 0;
        while (len < n + m - 1) len <<= 1, ++bit;
        
        a.resize(len); b.resize(len);
        auto rev = _get_rev(len, bit);
        
        _transform(a, rev, false);
        _transform(b, rev, false);
        for (int i = 0; i < len; ++i)
            a[i] = a[i] * b[i] % Mod;
        _transform(a, rev, true);
        
        a.resize(n + m - 1);
        return a;
    }
    
    static vector<ll> self_convolve(vector<ll> a) {
        int n = a.size();
        if (n == 0) return {};

        int len = 1, bit = 0;
        while (len < 2*n - 1) len <<= 1, ++bit;

        vector<int> rev = _get_rev(len, bit);
        a.resize(len);

        // 只需一次正变换
        _transform(a, rev, false);
        
        // 点乘平方
        for (int i = 0; i < len; ++i)
            a[i] = a[i] * a[i] % Mod;

        _transform(a, rev, true);
        a.resize(2*n - 1);
        return a;
    }
};

NTT<mod, 3> ntt;
bool isp[maxn];

struct DS {
    vector<ll> a, b;
    ll maxidx;
    ll p=-1;
    vector<ll> conv;
    bool is_symmetrical;
    
    DS (ll x, ll y, bool is_symmetrical_=false): 
            maxidx(0), 
            p(-1), 
            is_symmetrical(is_symmetrical_) {
        a.push_back(x);
        b.push_back(y);
    }
    
    void add(ll x, ll y){
        maxidx++;
        a.push_back(x);
        b.push_back(y);
        
        if (isp[maxidx]){
            p = maxidx;
            conv = is_symmetrical? ntt.self_convolve(a): ntt.convolve(a, b);
        }
    }
    
    ll calc(){
        if ((p<<1) < maxidx){
            ll ans = 0;
            for (int i=0; i<=maxidx; i++){
                ans += a[i] * b[maxidx-i] % mod;
                ans %= mod;
            }
            return ans;
        } 
        
        ll ans = conv[maxidx], add=0;
        for (int i=0; i<maxidx-p; i++){
            add += a[i] * b[maxidx-i] % mod;
            add %= mod;
        }
        if (is_symmetrical) {
            add <<= 1;
            add %= mod;
        } else {
            for (int i=p+1; i<=maxidx; i++){
                add += a[i] * b[maxidx-i] % mod;
                add %= mod;
            }
        }
        
        return (ans + add) % mod;
    }
};

const ll mu = 3;
ll n[maxn];
ll f[maxn], g[maxn];

inline void solve(ll N){
    for (int p=4; p<=N; p+=mu*sqrt(p*log2(p))){
        isp[p] = true;
    }
    
    f[0] = 1;
    g[0] = 4;
    
    DS ffds(1, 1, true), 
       fgds(1, 4);
    
    for (int i=1; i<=N; i++){
        f[i] = (fgds.calc() + 
                (i%3==1? (f[(i-1)/3]<<1): 0)) 
               % mod * one_sixth % mod;
        ffds.add(f[i], f[i]);
        g[i] = (ffds.calc() + 
                ((i&1)? 0: (f[i>>1]*3))) % mod;
        fgds.add(f[i], g[i]);
    }
}

int main(){
    ll T, N=0;
    fread(T);
    for (int i=1; i<=T; i++){
        fread(n[i]);
        N = max(N, n[i]);
    }    
    
    solve(N);
    
    for (int i=1; i<=T; i++){
        fwrite(f[n[i]]);
        putchar('\n');
    }
    
    return 0;
}

有没有人发现，Yet Another Alkyls Counting Algorithm 的首字母缩写是 YAACA，然后让我们把 AA 看成 M……一阵强劲的音乐响起

YA! 烷基计数方法

问题

状态转移方程

前置知识

转移方程

从 O(n^3) 到 O(n^2)

换上下限

分离变量

从 O(n^2) 到 O(n sqrt(nlogn))

一个块长调一天

块长最优性证明

核心真伪难辨代码片段

关于时间复杂度与优绩主义的桎梏

P-1 烷基计数

题目背景

题目描述

输入格式

输出格式

数据范围

番外：卡常小能手

附录：题目的 C++ 实现