Featured image of post 量子线路搜索研究(QAS, Quantum Architecture Search)

量子线路搜索研究(QAS, Quantum Architecture Search)

系统梳理量子线路搜索(QAS)的研究脉络:从问题定义、搜索策略分类、关键挑战到未来方向。

1. 背景与动机

量子计算的核心优势在于利用量子态的叠加与纠缠,在特定问题上实现超越经典计算的加速。然而,这一优势并非免费获得——量子算法的性能高度依赖于量子线路的架构设计。一个设计精妙的线路可以在噪声中等规模量子(NISQ)设备上完成任务,而一个随意堆叠的线路则可能完全淹没在退相干噪声中。

传统上,量子线路设计依赖领域专家的物理直觉和手工推导。这种范式在小规模系统中行之有效:Shor 算法、Grover 搜索、变分量子本征求解器(VQE)等代表性工作的线路结构均由研究者精心构造。然而,当量子比特数扩展到数十乃至上百个时,手动设计的瓶颈迅速暴露:

  • 搜索空间指数爆炸:$N$ 量子比特上的任意线路组合数随 $N$ 指数增长,人类无法高效探索
  • 硬件异构性:不同量子硬件(超导、离子阱、光量子)的噪声特性、连通拓扑和原生门集差异巨大,为每一类硬件手工优化线路不切实际
  • 任务多样性:从量子化学到组合优化到机器学习,不同应用对线路的要求各异,没有"万能架构"

这些挑战催生了**量子架构搜索(Quantum Architecture Search, QAS)**这一研究方向。QAS 的核心理念是:将量子线路的设计过程自动化,由搜索算法在预定义的搜索空间中寻找最优或近最优的线路结构。这一思路借鉴了经典机器学习中神经架构搜索(NAS)的成功经验,同时必须应对量子系统特有的复杂性——指数大的希尔伯特空间、不可克隆定理对中间态观测的限制,以及 NISQ 时代噪声的深刻影响。

2. 量子线路搜索问题定义

QAS 可以形式化为一个组合优化问题。给定:

  • 一个 $N$-量子比特的量子系统
  • 一个可用的量子门集合 $\mathcal{G}$(包括单量子比特门和双量子比特门)
  • 硬件连通拓扑 $\mathcal{T}$(规定了哪些量子比特对之间可以直接施加双量子比特门)
  • 一个目标量子任务(如基态能量估计、量子分类、或酉算子编译)

QAS 的目标是在搜索空间 $\mathcal{S}$ 中找到一个量子线路架构 $\alpha$,使得在给定评估度量 $\mathcal{M}$ 下最优:

$$ \alpha^* = \arg\max_{\alpha \in \mathcal{S}} \mathcal{M}(\alpha) $$

搜索空间 $\mathcal{S}$ 定义了所有候选线路的集合。其设计需要在表达能力和搜索效率之间权衡:空间过小会遗漏高质量架构,空间过大会使搜索计算不可承受。

搜索策略决定了如何在 $\mathcal{S}$ 中高效探索。这是 QAS 研究的核心,不同策略的选择直接影响搜索的质量和效率(详见第 3 节)。

评估度量 $\mathcal{M}$ 通常包含多个维度的权衡:

  • 保真度/准确率:线路输出与目标输出的接近程度
  • 线路深度:直接影响退相干噪声的影响程度
  • 双量子比特门计数:双量子比特门的错误率通常比单量子比特门高 1-2 个数量级,因此门计数是 NISQ 设备上的关键指标
  • 可训练性:对于变分线路,还需要考虑贫瘠高原(barren plateau)问题

这是一个典型的多目标黑箱优化问题:评估一次线路需要在量子模拟器或真实硬件上执行,成本高昂;搜索空间离散且高度非凸;目标函数缺乏解析梯度。

3. 已有搜索方案分类

QAS 领域的搜索策略可以归纳为六条主要技术路线。以下分类不是互斥的——近年来出现了大量融合多种策略的混合方法。

3.1 基于强化学习的方法

强化学习(RL)将 QAS 建模为序贯决策问题:agent 在每个时间步选择一个量子门并作用于特定量子比特,环境返回线路性能作为奖励。这种建模自然地捕捉了线路的顺序构造过程。

早期工作如 Zhang et al. (2021) 使用 Q-learning 在离散动作空间中搜索线路。后续研究引入了策略梯度方法和 actor-critic 架构,通过将线路结构编码为观察状态来提升搜索效率。RL 方法的优势在于其探索-利用的天然平衡机制,但也面临奖励稀疏(线路只有完整执行后才能评估)和样本效率低的挑战。

代表性工作

  • Quantum Circuit Architecture Search with Reinforcement Learning (Zhang et al., 2021)
  • Policy Gradient based Quantum Architecture Search (Du et al., 2022)

3.2 基于进化算法的方法

进化算法(Evolutionary Algorithms, EA)将"适者生存"原则应用于线路种群:初始化一组随机线路,每轮迭代通过变异和交叉操作生成新的候选线路,保留性能最优的子集。

EA 方法的核心优势在于其天然的并行性——种群中所有个体的评估可以独立进行——以及对离散搜索空间的自然适配。遗传编程(Genetic Programming) 特别适合 QAS,因为线路天然可以表示为树或图结构,而 GP 正是为这类结构化的程序合成设计的。

代表性工作

  • Evolutionary Quantum Architecture Search (Ding & Spector, 2022)
  • Genetic Programming for Quantum Circuit Design (Lukac & Perkowski, 2021)

3.3 基于梯度优化的方法

可微分 QAS(Differentiable QAS)将离散的架构选择松弛为连续参数,使得可以使用梯度下降进行优化。这一思路直接借鉴了 DARTS(Differentiable Architecture Search)在经典 NAS 中的成功。

核心技巧是引入架构参数 $\theta$ 和操作权重 $w$ 的双层优化:外层优化 $\theta$ 选择线路结构,内层优化 $w$ 训练变分参数。通过 Gumbel-Softmax 或 Straight-Through Estimator 等技巧处理离散选择的不可微性。

这种方法的优势是搜索效率高(利用梯度信息),但其代价是松弛带来的偏差——连续优化找到的解不一定对应最优的离散架构。此外,双层优化的计算开销仍然显著。

代表性工作

  • Differentiable Quantum Architecture Search (Zhang et al., 2022)
  • DQAS: Differentiable Quantum Architecture Search for VQE (Shi et al., 2023)

3.4 基于蒙特卡洛树搜索的方法

蒙特卡洛树搜索(MCTS)通过构建搜索树并平衡探索与利用来逐步扩展有前景的线路。MCTS 的四个标准步骤——选择、扩展、模拟、回传——自然地映射到量子线路的逐层构造过程。

与 RL 方法相比,MCTS 通过树结构显式维护搜索历史,避免了重复探索相同的线路前缀。与进化算法相比,MCTS 的树策略提供了更精细的探索-利用控制。然而,标准 MCTS 假设动作间相互独立,而量子线路中量子门之间存在非平凡的关联(如 commutation relation),这对 MCTS 的建模提出了额外要求。

代表性工作

  • MCTS: Monte Carlo Tree Search for Quantum Architecture Search (Wang et al., 2021)
  • GDMCTS-QAS: Graph-based Dynamic Monte Carlo Tree Search for Quantum Architecture Search (Huang et al., 2026) (Ours)

3.5 基于贝叶斯优化的方法

贝叶斯优化(Bayesian Optimization, BO)是一类专为昂贵黑箱优化设计的方法,天然适合 QAS 中"评估一次线路代价高、样本量受限"的场景。BO 的核心由两部分构成:一个概率代理模型(通常为高斯过程)拟合已评估线路的性能分布,以及一个采集函数(acquisition function)在探索不确定区域与利用已知高性能区域之间做出决策。

与 RL 和 EA 需要大量评估样本不同,BO 在样本效率上具有显著优势——每一条被选中评估的线路都经过采集函数的审慎权衡,从而在有限评估预算下获得更好的搜索结果。然而,BO 面临两个主要挑战:

  • 搜索空间的结构化表示:标准 BO 依赖连续或低维离散空间上的高斯过程先验,而量子线路是高维、结构化、组合性的。如何为线路空间设计合适的核函数(kernel)是 BO-QAS 的核心难点
  • 高维扩展:当线路参数(结构参数 + 变分参数)超过几十维时,高斯过程的拟合质量和采集函数的优化都急剧退化

针对第一个挑战,研究者尝试将线路结构编码为图或序列的隐向量,在低维连续隐空间中进行 BO;针对第二个挑战, trust region BO(TuRBO)和神经网络替代高斯过程(Deep Kernel Learning)等方向正在被引入 QAS。

代表性工作

  • Bayesian Optimization for Quantum Architecture Search (Sung et al., 2020)
  • Weighted BO for Variational Quantum Algorithms (Self et al., 2021)
  • Gaussian Process-based Surrogate Models for Quantum Circuit Search (Iannelli & Jansen, 2022)

3.6 基于代理模型/预测器的方法

这类方法的核心思想是:训练一个快速预测器来替代昂贵的完整模拟评估,从而大幅提升搜索的吞吐量。代理模型(surrogate model)或性能预测器(performance predictor)本身不执行搜索,而是作为搜索算法的"加速引擎"。

典型的工作流程如下:

  1. 随机采样或由搜索策略提议一批候选线路
  2. 对其中一小部分进行完整模拟评估,获得真实性能标签
  3. 训练预测器(如 GNN、Transformer、或集成模型)从线路结构中预测性能
  4. 用预测器快速筛选大量候选,仅对最有潜力的少量线路进行真实评估
  5. 将新评估结果加入训练集,迭代更新预测器

这一范式在经典 NAS 中已被广泛验证(如 NAS-Bench 系列的准确率预测器),但在 QAS 中面临独特的挑战:量子线路性能受到噪声、门错误、以及量子态指数大空间的共同影响,预测器的泛化误差更难控制。

代表性工作

  • Neural Predictor for Quantum Architecture Search (Zhang et al., 2021)
  • Graph Neural Network-based Performance Prediction for Quantum Circuits (Chen et al., 2023)
  • QAS-Predictor: Transferable Performance Prediction for VQE Circuits (Lu et al., 2024)

值得一提的是,预测器方法与贝叶斯优化存在自然结合点——预测器可以作为 BO 中高斯过程的替代或补充,在表达能力(深度模型)和不确定性量化(概率模型)之间取长补短。

3.7 方法对比小结

方法类别搜索效率样本效率解的质量可扩展性硬件感知主要局限
强化学习中等较低较高中等可支持奖励稀疏,策略梯度方差大
进化算法较低较低较高较好易于集成评估次数多,收敛慢
梯度优化较高中等中等较好需松弛处理松弛偏差,双层优化开销
MCTS中等中等较高中等可支持树结构内存开销,门关联建模
贝叶斯优化中等较高较高有限可支持高维空间退化,核函数设计困难
预测器/代理模型较高较高取决于预测精度较好需额外训练预测误差累积,冷启动问题

4. 关键挑战

尽管近年来 QAS 领域取得了显著进展,以下挑战仍然制约着该方向的实用化:

4.1 评估瓶颈

每一次候选线路的评估都需要在量子模拟器或真实硬件上执行。经典模拟 $N$ 量子比特系统的代价为 $O(2^N)$,使得超过 30 量子比特的精确模拟几乎不可行。在真实硬件上评估虽然避免了模拟开销,但受限于量子设备的可用性和排队时间。这一瓶颈直接限制了搜索算法可以评估的候选线路数量,也使得需要大量样本的方法(如进化算法和 RL)在中等以上规模系统中捉襟见肘。

针对这一问题,研究者提出了多种加速策略:

  • 代理模型(surrogate model):训练一个快速但近似的性能预测器替代完整模拟
  • 早停机制(early stopping):在部分训练轮次后即判断线路潜力,过滤明显劣质的候选
  • 权重共享(weight sharing):类似经典 NAS 中的 ENAS,让不同架构共享变分参数以减少重训练成本

然而,代理模型的预测误差、早停的漏判风险、以及量子领域中权重共享的理论可行性仍然是开放问题。

4.2 噪声建模与迁移

在 NISQ 时代,噪声是无法回避的现实。QAS 搜索到的最优线路,在实际硬件上运行时可能因为噪声而性能大幅下降。理想的 QAS 应该将噪声感知纳入搜索过程,即在评估阶段就考虑硬件噪声模型。

更进一步,跨硬件迁移是一个更具野心的目标:在一个硬件上搜索到的线路架构,能否通过微调适配另一类硬件?这要求搜索算法能够将硬件拓扑、门保真度等物理约束编码为搜索空间的一部分,而非后验的适配步骤。

4.3 可扩展性

目前 QAS 的 benchmark 大多集中在 4-12 个量子比特。对于实际有意义的量子应用(如复杂分子模拟需要 50+ 逻辑量子比特),搜索空间和评估代价的双重爆炸使现有方法难以胜任。

可能的突破方向包括:

  • 利用线路的局部性对称性先验压缩搜索空间
  • 采用层次化搜索策略,先在粗粒度上确定线路骨架,再细化门参数
  • 借助经典图神经网络(GNN) 编码线路结构以支持迁移学习

4.4 可解释性与泛化

当前多数 QAS 方法像一个黑箱:给定任务,产出线路,但难以解释"为什么这个线路结构有效"。缺乏可解释性带来了两个后果:一是研究者难以从搜索结果中提炼可复用的设计原则;二是搜索出的线路在略微变化的任务上可能完全失效。

一个值得探索的方向是将物理先验显式注入搜索过程——例如,利用对称性守恒律约束搜索空间,或借鉴量子纠错码的结构模式——从而让搜索结果具有更强的理论支撑和泛化能力。

5. 未来方向与展望

QAS 作为一个交叉领域,正受到量子计算、自动机器学习和优化理论三个社区的关注。以下几个方向值得关注:

LLM + QAS:大语言模型(LLM)在代码生成和程序合成中展现的能力,是否可以向生成量子线路迁移?初步工作表明,LLM 在理解量子门语义和线路模式方面具有潜力,但如何将 LLM 的"生成建议"与 QAS 的"严格评估"结合起来,尚缺乏成熟的框架。

面向特定硬件的定制化搜索:随着量子硬件走向更多样化(超导、离子阱、中性原子、光子),针对特定硬件拓扑和噪声特征定制搜索策略将成为刚需。这不仅涉及搜索空间的定义,更要求评估模块能够以合理的代价产生硬件相关的性能估计。

分布式搜索:Google 的量子优势实验已经表明,大规模量子线路评估需要可观的经典计算资源。将 QAS 搜索分发到 GPU 集群或异构计算平台,有望突破当前单机评估的规模限制。

与量子纠错协同设计:随着量子纠错码的进步,未来的 QAS 将从搜索"物理比特线路"过渡到搜索"逻辑比特线路"。这意味着搜索空间的定义、噪声模型的设定、以及评估度量都需要重新审视。

对于我个人而言,我们的工作GDMCTS-QAS 工作(见另一篇博客)提出了一种基于图的动态蒙特卡洛树搜索方法,试图在搜索效率和线路质量之间找到新的平衡。欢迎感兴趣的读者进一步阅读。