[{"content":" 📝 备注一句话概括本文核心：我们提出一个全新的量子线路自动搜索架构，用 DAG 图表示量子线路层，利用合理的方法大幅降低了搜索空间，并结合改良的 Monte Carlo Tree Search 方法，在同一个框架下测试了 VQE、QML、MaxCut 三种自动化设计量子线路任务，找到的线路比手工设计的线路更浅、更准、双比特门更少。 🎉🎉🎉\n一、如何自动设计量子线路呢？ 1. 手工设计量子线路的困境假设你是一个计算机专业的硕士生，而你此前并没有量子力学和量子计算的知识基础（正是本人😭），而你的研究方向是量子计算和量子机器学习。有一天，你的导师突然问你：“能不能设计一个量子线路，用于解决 MNIST 手写数字二分类问题？” 此时你一脸懵逼，回答：“我不会啊！！我只会用传统 CNN ！！”\n因为传统 CNN 只需设计一系列的卷积层、池化层、全连接层和不同的激活函数即可，训练过程让它自己慢慢折腾即可。而量子线路你需要设定线路的深度是多少？不同层放量子门型又是什么？哪里放旋转门？哪里放纠缠门？头都大了😆，即使你是量子计算的专家，也不敢保证他们手工设计出来的量子线路稳定又有效。\n手工设计通常依赖研究者的直觉：我觉得这里用 $Ry$，我觉得这里加 $CNOT$，我觉得堆 3 层 entanglement layer，我觉得这个 ansatz 应该有效。但问题是，不同任务需要的线路结构可能完全不同。比如 MNIST 二分类、量子化学基态能量估计、组合优化、量子态分类，它们对线路的要求不一样。一个在 MNIST 上有效的线路，不一定在别的任务上有效。\n一个量子线路可以由很多因素决定：\n量子比特数量子门类型门的顺序门作用在哪些 qubit 上纠缠连接方式线路深度参数共享方式测量方式硬件拓扑约束哪怕只考虑几个 qubit，可能的线路组合也非常多，组合数量会迅速爆炸，是指数级别增长的。所以，自动设计量子线路很有必要，靠人工设计量子线路不知要设计到猴年马月😓\n2. 自动设计量子线路的步骤自动化搜索量子线路的第一步，是把“设计线路”形式化成一个搜索问题。\n一个量子线路可以看成一串操作：\n1 2 3 4 5 第 1 步：在 q0 上放 Ry 门第 2 步：在 q1 上放 Rz 门第 3 步：在 q0 和 q1 之间放 CNOT 第 4 步：在 q2 上放 Rx 门 …… 也就是说，设计线路本质上是在不断回答几个问题：选什么量子门？放在哪些 qubit 上？放在第几层？要不要加纠缠？线路什么时候停止？\n于是，量子线路搜索可以被看成：\n1 2 3 4 5 6 7 8 9 从空线路开始 ↓ 一步步添加量子门 ↓ 形成候选量子线路 ↓ 训练并评估性能 ↓ 保留更好的线路用一句话说：\n自动化量子线路搜索，就是让算法在巨大的线路结构空间中，自动寻找高性能、低成本、硬件友好的量子线路。\n1. 先定义搜索空间：算法能选什么？自动化搜索不是凭空搜索。我们首先要告诉算法：你可以从哪些“积木”里搭线路。\n这些积木通常包括：\n1 2 3 4 5 6 单比特门：Rx, Ry, Rz, H 双比特门：CNOT, CZ, iSWAP 可训练参数门：Ry(θ), Rz(θ) 测量方式：测量 q0，或者测量多个 qubit 纠缠模式：线性、环形、全连接、硬件拓扑连接线路深度限制：最多几层比如一个简单搜索空间可以是：\n1 2 3 4 Gate set = {Rx, Ry, Rz, CNOT} 最大深度 = 6 量子比特数 = 4 只允许相邻 qubit 使用 CNOT 这样搜索算法就不会乱来。它不会生成硬件上无法执行的线路，也不会无限制地堆门。\n2. 再定义评价指标：什么叫“好线路”？自动化搜索的关键不只是“找到能跑的线路”，而是要定义什么叫“好”。\n对于 MNIST 二分类，最直接的目标是：分类准确率越高越好。但量子线路不能只看准确率。因为线路太深、双比特门太多，在真实量子硬件上很容易被噪声毁掉。\n所以更合理的评价指标通常是多目标的：\n1 2 3 4 5 6 7 准确率高线路深度浅双比特门数量少参数数量少符合硬件拓扑训练稳定噪声鲁棒性好可以写成一个综合得分： $$ Score = Accuracy - \\lambda_1 \\cdot Depth - \\lambda_2 \\cdot CNOTs - \\lambda_3 \\cdot Parameters $$ 意思是：准确率越高，分数越高；线路越深、$CNOT$ 越多、参数越多，分数越低。这样搜索出来的线路不会只是“很准但很臃肿”，而是更接近真正可用的量子线路。\n3. 核心流程：生成、训练、评估、更新一个典型的自动化量子线路搜索流程可以写成这样：\n1 2 3 4 5 6 7 8 9 10 11 12 13 空线路 ↓ 添加量子门 ↓ 候选线路 ↓ 训练参数θ ↓ 验证集评估 ↓ 搜索算法决定下一步怎么走 ↓ 输出最优线路这里要注意一点：搜索线路结构和训练线路参数是两个层次的问题。\n结构搜索回答的是：这个门该不该放？放在哪？线路长什么样？\n参数训练回答的是：这个 $Ry(θ)$ 的 $θ$ 应该是多少？这个 $Rz(θ)$ 的 $θ$ 应该是多少？\n所以完整流程其实是一个双层优化问题：\n内层优化线路参数，给定一个量子线路结构 $\\mathcal{A}$，我们先训练它的参数： $$ \\theta^{*}(\\mathcal{A}) = \\arg\\min_{\\theta} \\mathcal{L}_{\\mathrm{train}}(\\theta,\\mathcal{A}) $$意思是：如果线路结构已经固定，那么就像训练普通神经网络一样，优化其中的参数 $\\theta$，让训练集 loss 尽可能小。\n外层优化线路结构，给定一个量子线路结构 $\\mathcal{A}$，先训练出最优参数 $\\theta^{*}$，再训练结构： $$ \\mathcal{A}^{*} = \\arg\\min_{\\mathcal{A}\\in\\Omega} \\mathcal{L}_{\\mathrm{val}} \\left( \\theta^{*}(\\mathcal{A}), \\mathcal{A} \\right) $$ 在验证集上评估它的效果，最后选择验证集表现最好的线路结构。\n二、为什么不用传统蒙特卡洛树搜索？三、我们的方法流程是什么样的？四、我们设计的实验结果如何？五、我们的方法有什么缺点？六、量子线路搜索今后如何发展？ ","date":"2026-05-28T21:02:34+08:00","image":"/p/gdmcts-qas/cover.jpg","permalink":"/p/gdmcts-qas/","title":"GDMCTS-QAS: Graph based Dynamic Monte Carlo Tree Search for Quantum Architecture Search"},{"content":"1. 背景与动机量子计算的核心优势在于利用量子态的叠加与纠缠，在特定问题上实现超越经典计算的加速。然而，这一优势并非免费获得——量子算法的性能高度依赖于量子线路的架构设计。一个设计精妙的线路可以在噪声中等规模量子（NISQ）设备上完成任务，而一个随意堆叠的线路则可能完全淹没在退相干噪声中。\n传统上，量子线路设计依赖领域专家的物理直觉和手工推导。这种范式在小规模系统中行之有效：Shor 算法、Grover 搜索、变分量子本征求解器（VQE）等代表性工作的线路结构均由研究者精心构造。然而，当量子比特数扩展到数十乃至上百个时，手动设计的瓶颈迅速暴露：\n搜索空间指数爆炸：$N$ 量子比特上的任意线路组合数随 $N$ 指数增长，人类无法高效探索硬件异构性：不同量子硬件（超导、离子阱、光量子）的噪声特性、连通拓扑和原生门集差异巨大，为每一类硬件手工优化线路不切实际任务多样性：从量子化学到组合优化到机器学习，不同应用对线路的要求各异，没有\u0026quot;万能架构\u0026quot; 这些挑战催生了**量子架构搜索（Quantum Architecture Search, QAS）**这一研究方向。QAS 的核心理念是：将量子线路的设计过程自动化，由搜索算法在预定义的搜索空间中寻找最优或近最优的线路结构。这一思路借鉴了经典机器学习中神经架构搜索（NAS）的成功经验，同时必须应对量子系统特有的复杂性——指数大的希尔伯特空间、不可克隆定理对中间态观测的限制，以及 NISQ 时代噪声的深刻影响。\n2. 量子线路搜索问题定义 QAS 可以形式化为一个组合优化问题。给定：\n一个 $N$-量子比特的量子系统一个可用的量子门集合 $\\mathcal{G}$（包括单量子比特门和双量子比特门）硬件连通拓扑 $\\mathcal{T}$（规定了哪些量子比特对之间可以直接施加双量子比特门）一个目标量子任务（如基态能量估计、量子分类、或酉算子编译） QAS 的目标是在搜索空间 $\\mathcal{S}$ 中找到一个量子线路架构 $\\alpha$，使得在给定评估度量 $\\mathcal{M}$ 下最优：\n$$ \\alpha^* = \\arg\\max_{\\alpha \\in \\mathcal{S}} \\mathcal{M}(\\alpha) $$搜索空间 $\\mathcal{S}$ 定义了所有候选线路的集合。其设计需要在表达能力和搜索效率之间权衡：空间过小会遗漏高质量架构，空间过大会使搜索计算不可承受。\n搜索策略决定了如何在 $\\mathcal{S}$ 中高效探索。这是 QAS 研究的核心，不同策略的选择直接影响搜索的质量和效率（详见第 3 节）。\n评估度量 $\\mathcal{M}$ 通常包含多个维度的权衡：\n保真度/准确率：线路输出与目标输出的接近程度线路深度：直接影响退相干噪声的影响程度双量子比特门计数：双量子比特门的错误率通常比单量子比特门高 1-2 个数量级，因此门计数是 NISQ 设备上的关键指标可训练性：对于变分线路，还需要考虑贫瘠高原（barren plateau）问题这是一个典型的多目标黑箱优化问题：评估一次线路需要在量子模拟器或真实硬件上执行，成本高昂；搜索空间离散且高度非凸；目标函数缺乏解析梯度。\n3. 已有搜索方案分类 QAS 领域的搜索策略可以归纳为六条主要技术路线。以下分类不是互斥的——近年来出现了大量融合多种策略的混合方法。\n3.1 基于强化学习的方法强化学习（RL）将 QAS 建模为序贯决策问题：agent 在每个时间步选择一个量子门并作用于特定量子比特，环境返回线路性能作为奖励。这种建模自然地捕捉了线路的顺序构造过程。\n早期工作如 Zhang et al. (2021) 使用 Q-learning 在离散动作空间中搜索线路。后续研究引入了策略梯度方法和 actor-critic 架构，通过将线路结构编码为观察状态来提升搜索效率。RL 方法的优势在于其探索-利用的天然平衡机制，但也面临奖励稀疏（线路只有完整执行后才能评估）和样本效率低的挑战。\n代表性工作：\nQuantum Circuit Architecture Search with Reinforcement Learning (Zhang et al., 2021) Policy Gradient based Quantum Architecture Search (Du et al., 2022) 3.2 基于进化算法的方法进化算法（Evolutionary Algorithms, EA）将\u0026quot;适者生存\u0026quot;原则应用于线路种群：初始化一组随机线路，每轮迭代通过变异和交叉操作生成新的候选线路，保留性能最优的子集。\nEA 方法的核心优势在于其天然的并行性——种群中所有个体的评估可以独立进行——以及对离散搜索空间的自然适配。遗传编程（Genetic Programming）特别适合 QAS，因为线路天然可以表示为树或图结构，而 GP 正是为这类结构化的程序合成设计的。\n代表性工作：\nEvolutionary Quantum Architecture Search (Ding \u0026amp; Spector, 2022) Genetic Programming for Quantum Circuit Design (Lukac \u0026amp; Perkowski, 2021) 3.3 基于梯度优化的方法可微分 QAS（Differentiable QAS）将离散的架构选择松弛为连续参数，使得可以使用梯度下降进行优化。这一思路直接借鉴了 DARTS（Differentiable Architecture Search）在经典 NAS 中的成功。\n核心技巧是引入架构参数 $\\theta$ 和操作权重 $w$ 的双层优化：外层优化 $\\theta$ 选择线路结构，内层优化 $w$ 训练变分参数。通过 Gumbel-Softmax 或 Straight-Through Estimator 等技巧处理离散选择的不可微性。\n这种方法的优势是搜索效率高（利用梯度信息），但其代价是松弛带来的偏差——连续优化找到的解不一定对应最优的离散架构。此外，双层优化的计算开销仍然显著。\n代表性工作：\nDifferentiable Quantum Architecture Search (Zhang et al., 2022) DQAS: Differentiable Quantum Architecture Search for VQE (Shi et al., 2023) 3.4 基于蒙特卡洛树搜索的方法蒙特卡洛树搜索（MCTS）通过构建搜索树并平衡探索与利用来逐步扩展有前景的线路。MCTS 的四个标准步骤——选择、扩展、模拟、回传——自然地映射到量子线路的逐层构造过程。\n与 RL 方法相比，MCTS 通过树结构显式维护搜索历史，避免了重复探索相同的线路前缀。与进化算法相比，MCTS 的树策略提供了更精细的探索-利用控制。然而，标准 MCTS 假设动作间相互独立，而量子线路中量子门之间存在非平凡的关联（如 commutation relation），这对 MCTS 的建模提出了额外要求。\n代表性工作：\nMCTS: Monte Carlo Tree Search for Quantum Architecture Search (Wang et al., 2021) GDMCTS-QAS: Graph-based Dynamic Monte Carlo Tree Search for Quantum Architecture Search (Huang et al., 2026) (Ours) 3.5 基于贝叶斯优化的方法贝叶斯优化（Bayesian Optimization, BO）是一类专为昂贵黑箱优化设计的方法，天然适合 QAS 中\u0026quot;评估一次线路代价高、样本量受限\u0026quot;的场景。BO 的核心由两部分构成：一个概率代理模型（通常为高斯过程）拟合已评估线路的性能分布，以及一个采集函数（acquisition function）在探索不确定区域与利用已知高性能区域之间做出决策。\n与 RL 和 EA 需要大量评估样本不同，BO 在样本效率上具有显著优势——每一条被选中评估的线路都经过采集函数的审慎权衡，从而在有限评估预算下获得更好的搜索结果。然而，BO 面临两个主要挑战：\n搜索空间的结构化表示：标准 BO 依赖连续或低维离散空间上的高斯过程先验，而量子线路是高维、结构化、组合性的。如何为线路空间设计合适的核函数（kernel）是 BO-QAS 的核心难点高维扩展：当线路参数（结构参数 + 变分参数）超过几十维时，高斯过程的拟合质量和采集函数的优化都急剧退化针对第一个挑战，研究者尝试将线路结构编码为图或序列的隐向量，在低维连续隐空间中进行 BO；针对第二个挑战， trust region BO（TuRBO）和神经网络替代高斯过程（Deep Kernel Learning）等方向正在被引入 QAS。\n代表性工作：\nBayesian Optimization for Quantum Architecture Search (Sung et al., 2020) Weighted BO for Variational Quantum Algorithms (Self et al., 2021) Gaussian Process-based Surrogate Models for Quantum Circuit Search (Iannelli \u0026amp; Jansen, 2022) 3.6 基于代理模型/预测器的方法这类方法的核心思想是：训练一个快速预测器来替代昂贵的完整模拟评估，从而大幅提升搜索的吞吐量。代理模型（surrogate model）或性能预测器（performance predictor）本身不执行搜索，而是作为搜索算法的\u0026quot;加速引擎\u0026quot;。\n典型的工作流程如下：\n随机采样或由搜索策略提议一批候选线路对其中一小部分进行完整模拟评估，获得真实性能标签训练预测器（如 GNN、Transformer、或集成模型）从线路结构中预测性能用预测器快速筛选大量候选，仅对最有潜力的少量线路进行真实评估将新评估结果加入训练集，迭代更新预测器这一范式在经典 NAS 中已被广泛验证（如 NAS-Bench 系列的准确率预测器），但在 QAS 中面临独特的挑战：量子线路性能受到噪声、门错误、以及量子态指数大空间的共同影响，预测器的泛化误差更难控制。\n代表性工作：\nNeural Predictor for Quantum Architecture Search (Zhang et al., 2021) Graph Neural Network-based Performance Prediction for Quantum Circuits (Chen et al., 2023) QAS-Predictor: Transferable Performance Prediction for VQE Circuits (Lu et al., 2024) 值得一提的是，预测器方法与贝叶斯优化存在自然结合点——预测器可以作为 BO 中高斯过程的替代或补充，在表达能力（深度模型）和不确定性量化（概率模型）之间取长补短。\n3.7 方法对比小结方法类别搜索效率样本效率解的质量可扩展性硬件感知主要局限强化学习中等较低较高中等可支持奖励稀疏，策略梯度方差大进化算法较低较低较高较好易于集成评估次数多，收敛慢梯度优化较高中等中等较好需松弛处理松弛偏差，双层优化开销 MCTS 中等中等较高中等可支持树结构内存开销，门关联建模贝叶斯优化中等较高较高有限可支持高维空间退化，核函数设计困难预测器/代理模型较高较高取决于预测精度较好需额外训练预测误差累积，冷启动问题 4. 关键挑战尽管近年来 QAS 领域取得了显著进展，以下挑战仍然制约着该方向的实用化：\n4.1 评估瓶颈每一次候选线路的评估都需要在量子模拟器或真实硬件上执行。经典模拟 $N$ 量子比特系统的代价为 $O(2^N)$，使得超过 30 量子比特的精确模拟几乎不可行。在真实硬件上评估虽然避免了模拟开销，但受限于量子设备的可用性和排队时间。这一瓶颈直接限制了搜索算法可以评估的候选线路数量，也使得需要大量样本的方法（如进化算法和 RL）在中等以上规模系统中捉襟见肘。\n针对这一问题，研究者提出了多种加速策略：\n代理模型（surrogate model）：训练一个快速但近似的性能预测器替代完整模拟早停机制（early stopping）：在部分训练轮次后即判断线路潜力，过滤明显劣质的候选权重共享（weight sharing）：类似经典 NAS 中的 ENAS，让不同架构共享变分参数以减少重训练成本然而，代理模型的预测误差、早停的漏判风险、以及量子领域中权重共享的理论可行性仍然是开放问题。\n4.2 噪声建模与迁移在 NISQ 时代，噪声是无法回避的现实。QAS 搜索到的最优线路，在实际硬件上运行时可能因为噪声而性能大幅下降。理想的 QAS 应该将噪声感知纳入搜索过程，即在评估阶段就考虑硬件噪声模型。\n更进一步，跨硬件迁移是一个更具野心的目标：在一个硬件上搜索到的线路架构，能否通过微调适配另一类硬件？这要求搜索算法能够将硬件拓扑、门保真度等物理约束编码为搜索空间的一部分，而非后验的适配步骤。\n4.3 可扩展性目前 QAS 的 benchmark 大多集中在 4-12 个量子比特。对于实际有意义的量子应用（如复杂分子模拟需要 50+ 逻辑量子比特），搜索空间和评估代价的双重爆炸使现有方法难以胜任。\n可能的突破方向包括：\n利用线路的局部性和对称性先验压缩搜索空间采用层次化搜索策略，先在粗粒度上确定线路骨架，再细化门参数借助经典图神经网络（GNN）编码线路结构以支持迁移学习 4.4 可解释性与泛化当前多数 QAS 方法像一个黑箱：给定任务，产出线路，但难以解释\u0026quot;为什么这个线路结构有效\u0026quot;。缺乏可解释性带来了两个后果：一是研究者难以从搜索结果中提炼可复用的设计原则；二是搜索出的线路在略微变化的任务上可能完全失效。\n一个值得探索的方向是将物理先验显式注入搜索过程——例如，利用对称性守恒律约束搜索空间，或借鉴量子纠错码的结构模式——从而让搜索结果具有更强的理论支撑和泛化能力。\n5. 未来方向与展望 QAS 作为一个交叉领域，正受到量子计算、自动机器学习和优化理论三个社区的关注。以下几个方向值得关注：\nLLM + QAS：大语言模型（LLM）在代码生成和程序合成中展现的能力，是否可以向生成量子线路迁移？初步工作表明，LLM 在理解量子门语义和线路模式方面具有潜力，但如何将 LLM 的\u0026quot;生成建议\u0026quot;与 QAS 的\u0026quot;严格评估\u0026quot;结合起来，尚缺乏成熟的框架。\n面向特定硬件的定制化搜索：随着量子硬件走向更多样化（超导、离子阱、中性原子、光子），针对特定硬件拓扑和噪声特征定制搜索策略将成为刚需。这不仅涉及搜索空间的定义，更要求评估模块能够以合理的代价产生硬件相关的性能估计。\n分布式搜索：Google 的量子优势实验已经表明，大规模量子线路评估需要可观的经典计算资源。将 QAS 搜索分发到 GPU 集群或异构计算平台，有望突破当前单机评估的规模限制。\n与量子纠错协同设计：随着量子纠错码的进步，未来的 QAS 将从搜索\u0026quot;物理比特线路\u0026quot;过渡到搜索\u0026quot;逻辑比特线路\u0026quot;。这意味着搜索空间的定义、噪声模型的设定、以及评估度量都需要重新审视。\n对于我个人而言，我们的工作GDMCTS-QAS 工作（见另一篇博客）提出了一种基于图的动态蒙特卡洛树搜索方法，试图在搜索效率和线路质量之间找到新的平衡。欢迎感兴趣的读者进一步阅读。\n","date":"2026-05-28T12:00:00+08:00","image":"/p/quantum-architecture-search/cover.jpg","permalink":"/p/quantum-architecture-search/","title":"量子线路搜索研究（QAS, Quantum Architecture Search）"},{"content":"欢迎这是我的第一篇博客文章！网站使用 Hugo 静态网站生成器和 Stack 主题搭建。\n使用的技术 Hugo — 快速、灵活的静态网站生成器 Stack 主题 — 卡片式设计，支持暗色模式 GitHub Pages — 免费托管静态网站后续计划以后会在这里分享更多技术相关的内容。\n","date":"2026-05-28T12:00:00+08:00","image":"/p/hello-world/cover.jpg","permalink":"/p/hello-world/","title":"我的第一篇博客"}]