量子线路搜索研究（QAS, Quantum Architecture Search）

1. 背景与动机

量子计算的核心优势在于利用量子态的叠加与纠缠，在特定问题上实现超越经典计算的加速。然而，这一优势并非免费获得——量子算法的性能高度依赖于量子线路的架构设计。一个设计精妙的线路可以在噪声中等规模量子（NISQ）设备上完成任务，而一个随意堆叠的线路则可能完全淹没在退相干噪声中。

传统上，量子线路设计依赖领域专家的物理直觉和手工推导。这种范式在小规模系统中行之有效：Shor 算法、Grover 搜索、变分量子本征求解器（VQE）等代表性工作的线路结构均由研究者精心构造。然而，当量子比特数扩展到数十乃至上百个时，手动设计的瓶颈迅速暴露：

搜索空间指数爆炸：$N$ 量子比特上的任意线路组合数随 $N$ 指数增长，人类无法高效探索
硬件异构性：不同量子硬件（超导、离子阱、光量子）的噪声特性、连通拓扑和原生门集差异巨大，为每一类硬件手工优化线路不切实际
任务多样性：从量子化学到组合优化到机器学习，不同应用对线路的要求各异，没有"万能架构"

这些挑战催生了**量子架构搜索（Quantum Architecture Search, QAS）**这一研究方向。QAS 的核心理念是：将量子线路的设计过程自动化，由搜索算法在预定义的搜索空间中寻找最优或近最优的线路结构。这一思路借鉴了经典机器学习中神经架构搜索（NAS）的成功经验，同时必须应对量子系统特有的复杂性——指数大的希尔伯特空间、不可克隆定理对中间态观测的限制，以及 NISQ 时代噪声的深刻影响。

2. 量子线路搜索问题定义

QAS 可以形式化为一个组合优化问题。给定：

一个 $N$-量子比特的量子系统
一个可用的量子门集合 $\mathcal{G}$（包括单量子比特门和双量子比特门）
硬件连通拓扑 $\mathcal{T}$（规定了哪些量子比特对之间可以直接施加双量子比特门）
一个目标量子任务（如基态能量估计、量子分类、或酉算子编译）

QAS 的目标是在搜索空间 $\mathcal{S}$ 中找到一个量子线路架构 $\alpha$，使得在给定评估度量 $\mathcal{M}$ 下最优：

$$ \alpha^* = \arg\max_{\alpha \in \mathcal{S}} \mathcal{M}(\alpha) $$

搜索空间 $\mathcal{S}$ 定义了所有候选线路的集合。其设计需要在表达能力和搜索效率之间权衡：空间过小会遗漏高质量架构，空间过大会使搜索计算不可承受。

搜索策略决定了如何在 $\mathcal{S}$ 中高效探索。这是 QAS 研究的核心，不同策略的选择直接影响搜索的质量和效率（详见第 3 节）。

评估度量 $\mathcal{M}$ 通常包含多个维度的权衡：

保真度/准确率：线路输出与目标输出的接近程度
线路深度：直接影响退相干噪声的影响程度
双量子比特门计数：双量子比特门的错误率通常比单量子比特门高 1-2 个数量级，因此门计数是 NISQ 设备上的关键指标
可训练性：对于变分线路，还需要考虑贫瘠高原（barren plateau）问题

这是一个典型的多目标黑箱优化问题：评估一次线路需要在量子模拟器或真实硬件上执行，成本高昂；搜索空间离散且高度非凸；目标函数缺乏解析梯度。

3. 已有搜索方案分类

QAS 领域的搜索策略可以归纳为六条主要技术路线。以下分类不是互斥的——近年来出现了大量融合多种策略的混合方法。

3.1 基于强化学习的方法

强化学习（RL）将 QAS 建模为序贯决策问题：agent 在每个时间步选择一个量子门并作用于特定量子比特，环境返回线路性能作为奖励。这种建模自然地捕捉了线路的顺序构造过程。

早期工作如 Zhang et al. (2021) 使用 Q-learning 在离散动作空间中搜索线路。后续研究引入了策略梯度方法和 actor-critic 架构，通过将线路结构编码为观察状态来提升搜索效率。RL 方法的优势在于其探索-利用的天然平衡机制，但也面临奖励稀疏（线路只有完整执行后才能评估）和样本效率低的挑战。

代表性工作：

Quantum Circuit Architecture Search with Reinforcement Learning (Zhang et al., 2021)
Policy Gradient based Quantum Architecture Search (Du et al., 2022)

3.2 基于进化算法的方法

进化算法（Evolutionary Algorithms, EA）将"适者生存"原则应用于线路种群：初始化一组随机线路，每轮迭代通过变异和交叉操作生成新的候选线路，保留性能最优的子集。

EA 方法的核心优势在于其天然的并行性——种群中所有个体的评估可以独立进行——以及对离散搜索空间的自然适配。遗传编程（Genetic Programming） 特别适合 QAS，因为线路天然可以表示为树或图结构，而 GP 正是为这类结构化的程序合成设计的。

代表性工作：

Evolutionary Quantum Architecture Search (Ding & Spector, 2022)
Genetic Programming for Quantum Circuit Design (Lukac & Perkowski, 2021)

3.3 基于梯度优化的方法

可微分 QAS（Differentiable QAS）将离散的架构选择松弛为连续参数，使得可以使用梯度下降进行优化。这一思路直接借鉴了 DARTS（Differentiable Architecture Search）在经典 NAS 中的成功。

核心技巧是引入架构参数 $\theta$ 和操作权重 $w$ 的双层优化：外层优化 $\theta$ 选择线路结构，内层优化 $w$ 训练变分参数。通过 Gumbel-Softmax 或 Straight-Through Estimator 等技巧处理离散选择的不可微性。

这种方法的优势是搜索效率高（利用梯度信息），但其代价是松弛带来的偏差——连续优化找到的解不一定对应最优的离散架构。此外，双层优化的计算开销仍然显著。

代表性工作：

Differentiable Quantum Architecture Search (Zhang et al., 2022)
DQAS: Differentiable Quantum Architecture Search for VQE (Shi et al., 2023)

3.4 基于蒙特卡洛树搜索的方法

蒙特卡洛树搜索（MCTS）通过构建搜索树并平衡探索与利用来逐步扩展有前景的线路。MCTS 的四个标准步骤——选择、扩展、模拟、回传——自然地映射到量子线路的逐层构造过程。

与 RL 方法相比，MCTS 通过树结构显式维护搜索历史，避免了重复探索相同的线路前缀。与进化算法相比，MCTS 的树策略提供了更精细的探索-利用控制。然而，标准 MCTS 假设动作间相互独立，而量子线路中量子门之间存在非平凡的关联（如 commutation relation），这对 MCTS 的建模提出了额外要求。

代表性工作：

MCTS: Monte Carlo Tree Search for Quantum Architecture Search (Wang et al., 2021)
GDMCTS-QAS: Graph-based Dynamic Monte Carlo Tree Search for Quantum Architecture Search (Huang et al., 2026) (Ours)

3.5 基于贝叶斯优化的方法

贝叶斯优化（Bayesian Optimization, BO）是一类专为昂贵黑箱优化设计的方法，天然适合 QAS 中"评估一次线路代价高、样本量受限"的场景。BO 的核心由两部分构成：一个概率代理模型（通常为高斯过程）拟合已评估线路的性能分布，以及一个采集函数（acquisition function）在探索不确定区域与利用已知高性能区域之间做出决策。

与 RL 和 EA 需要大量评估样本不同，BO 在样本效率上具有显著优势——每一条被选中评估的线路都经过采集函数的审慎权衡，从而在有限评估预算下获得更好的搜索结果。然而，BO 面临两个主要挑战：

搜索空间的结构化表示：标准 BO 依赖连续或低维离散空间上的高斯过程先验，而量子线路是高维、结构化、组合性的。如何为线路空间设计合适的核函数（kernel）是 BO-QAS 的核心难点
高维扩展：当线路参数（结构参数 + 变分参数）超过几十维时，高斯过程的拟合质量和采集函数的优化都急剧退化

针对第一个挑战，研究者尝试将线路结构编码为图或序列的隐向量，在低维连续隐空间中进行 BO；针对第二个挑战， trust region BO（TuRBO）和神经网络替代高斯过程（Deep Kernel Learning）等方向正在被引入 QAS。

代表性工作：

Bayesian Optimization for Quantum Architecture Search (Sung et al., 2020)
Weighted BO for Variational Quantum Algorithms (Self et al., 2021)
Gaussian Process-based Surrogate Models for Quantum Circuit Search (Iannelli & Jansen, 2022)

3.6 基于代理模型/预测器的方法

这类方法的核心思想是：训练一个快速预测器来替代昂贵的完整模拟评估，从而大幅提升搜索的吞吐量。代理模型（surrogate model）或性能预测器（performance predictor）本身不执行搜索，而是作为搜索算法的"加速引擎"。

典型的工作流程如下：

随机采样或由搜索策略提议一批候选线路
对其中一小部分进行完整模拟评估，获得真实性能标签
训练预测器（如 GNN、Transformer、或集成模型）从线路结构中预测性能
用预测器快速筛选大量候选，仅对最有潜力的少量线路进行真实评估
将新评估结果加入训练集，迭代更新预测器

这一范式在经典 NAS 中已被广泛验证（如 NAS-Bench 系列的准确率预测器），但在 QAS 中面临独特的挑战：量子线路性能受到噪声、门错误、以及量子态指数大空间的共同影响，预测器的泛化误差更难控制。

代表性工作：

Neural Predictor for Quantum Architecture Search (Zhang et al., 2021)
Graph Neural Network-based Performance Prediction for Quantum Circuits (Chen et al., 2023)
QAS-Predictor: Transferable Performance Prediction for VQE Circuits (Lu et al., 2024)

值得一提的是，预测器方法与贝叶斯优化存在自然结合点——预测器可以作为 BO 中高斯过程的替代或补充，在表达能力（深度模型）和不确定性量化（概率模型）之间取长补短。

3.7 方法对比小结

方法类别	搜索效率	样本效率	解的质量	可扩展性	硬件感知	主要局限
强化学习	中等	较低	较高	中等	可支持	奖励稀疏，策略梯度方差大
进化算法	较低	较低	较高	较好	易于集成	评估次数多，收敛慢
梯度优化	较高	中等	中等	较好	需松弛处理	松弛偏差，双层优化开销
MCTS	中等	中等	较高	中等	可支持	树结构内存开销，门关联建模
贝叶斯优化	中等	较高	较高	有限	可支持	高维空间退化，核函数设计困难
预测器/代理模型	较高	较高	取决于预测精度	较好	需额外训练	预测误差累积，冷启动问题

4. 关键挑战

尽管近年来 QAS 领域取得了显著进展，以下挑战仍然制约着该方向的实用化：

4.1 评估瓶颈

每一次候选线路的评估都需要在量子模拟器或真实硬件上执行。经典模拟 $N$ 量子比特系统的代价为 $O(2^N)$，使得超过 30 量子比特的精确模拟几乎不可行。在真实硬件上评估虽然避免了模拟开销，但受限于量子设备的可用性和排队时间。这一瓶颈直接限制了搜索算法可以评估的候选线路数量，也使得需要大量样本的方法（如进化算法和 RL）在中等以上规模系统中捉襟见肘。

针对这一问题，研究者提出了多种加速策略：

代理模型（surrogate model）：训练一个快速但近似的性能预测器替代完整模拟
早停机制（early stopping）：在部分训练轮次后即判断线路潜力，过滤明显劣质的候选
权重共享（weight sharing）：类似经典 NAS 中的 ENAS，让不同架构共享变分参数以减少重训练成本

然而，代理模型的预测误差、早停的漏判风险、以及量子领域中权重共享的理论可行性仍然是开放问题。

4.2 噪声建模与迁移

在 NISQ 时代，噪声是无法回避的现实。QAS 搜索到的最优线路，在实际硬件上运行时可能因为噪声而性能大幅下降。理想的 QAS 应该将噪声感知纳入搜索过程，即在评估阶段就考虑硬件噪声模型。

更进一步，跨硬件迁移是一个更具野心的目标：在一个硬件上搜索到的线路架构，能否通过微调适配另一类硬件？这要求搜索算法能够将硬件拓扑、门保真度等物理约束编码为搜索空间的一部分，而非后验的适配步骤。

4.3 可扩展性

目前 QAS 的 benchmark 大多集中在 4-12 个量子比特。对于实际有意义的量子应用（如复杂分子模拟需要 50+ 逻辑量子比特），搜索空间和评估代价的双重爆炸使现有方法难以胜任。

可能的突破方向包括：

利用线路的局部性和对称性先验压缩搜索空间
采用层次化搜索策略，先在粗粒度上确定线路骨架，再细化门参数
借助经典图神经网络（GNN） 编码线路结构以支持迁移学习

4.4 可解释性与泛化

当前多数 QAS 方法像一个黑箱：给定任务，产出线路，但难以解释"为什么这个线路结构有效"。缺乏可解释性带来了两个后果：一是研究者难以从搜索结果中提炼可复用的设计原则；二是搜索出的线路在略微变化的任务上可能完全失效。

一个值得探索的方向是将物理先验显式注入搜索过程——例如，利用对称性守恒律约束搜索空间，或借鉴量子纠错码的结构模式——从而让搜索结果具有更强的理论支撑和泛化能力。

5. 未来方向与展望

QAS 作为一个交叉领域，正受到量子计算、自动机器学习和优化理论三个社区的关注。以下几个方向值得关注：

LLM + QAS：大语言模型（LLM）在代码生成和程序合成中展现的能力，是否可以向生成量子线路迁移？初步工作表明，LLM 在理解量子门语义和线路模式方面具有潜力，但如何将 LLM 的"生成建议"与 QAS 的"严格评估"结合起来，尚缺乏成熟的框架。

面向特定硬件的定制化搜索：随着量子硬件走向更多样化（超导、离子阱、中性原子、光子），针对特定硬件拓扑和噪声特征定制搜索策略将成为刚需。这不仅涉及搜索空间的定义，更要求评估模块能够以合理的代价产生硬件相关的性能估计。

分布式搜索：Google 的量子优势实验已经表明，大规模量子线路评估需要可观的经典计算资源。将 QAS 搜索分发到 GPU 集群或异构计算平台，有望突破当前单机评估的规模限制。

与量子纠错协同设计：随着量子纠错码的进步，未来的 QAS 将从搜索"物理比特线路"过渡到搜索"逻辑比特线路"。这意味着搜索空间的定义、噪声模型的设定、以及评估度量都需要重新审视。

对于我个人而言，我们的工作GDMCTS-QAS 工作（见另一篇博客）提出了一种基于图的动态蒙特卡洛树搜索方法，试图在搜索效率和线路质量之间找到新的平衡。欢迎感兴趣的读者进一步阅读。