智猩猩Agentic整理

编辑:六一


当前,基于大语言模型的多智能体系统在复杂任务中展现出强大的协作能力,但其设计通常依赖人工配置,难以动态适应不同任务的需求;自动化工作流设计方法往往追求静态的“万能”架构,导致资源浪费或性能不足


为此,来自新加坡国立大学、上海 AI Lab等机构的研究人员引入智能体超网概念,并基于此提出了MaAS框架,可自动演化多智能体系统,自适应地为不同难度和领域的查询分配高效解决方案。


实验评估表明,该框架在六大基准测试中展现出显著优势:性能提升0.54%-16.89%,训练/推理成本显著降低,并具备优异的跨基准、跨大模型迁移能力和泛化性能



  • 论文标题:

    Multi-agent Architecture Search via Agentic Supernet

  • 论文链接:

    https://arxiv.org/pdf/2502.04180

  • 项目地址:

    https: //github.com/bingreeky/MaAS

1

方法



1、相关概念


(1)智能体算子(Agentic Operator)



论文将单/多智能体工作流统一抽象为算子O,以便在超网中灵活组合。一个智能体算子是由多个LLM调用Mi、一个提示词P和一组工具Ti组成的复合单元,代表一个完整的智能体调用过程。例如:


  • CoT(OCoT):单LLM、无工具

  • 多智能体辩论(ODebate):多LLM、多轮调用

  • Self‑RAG(OSRAG):单LLM,搜索引擎工具


(2)多智能体系统



多智能体系统是一个有向无环图,其中代表可行智能体算子集合,节点V是选中的算子,边ε表示算子间的连接关系。


(3)智能体超网(Agentic Supernet)



智能体超网是一个概率化的多层级架构分布,其中π(O)表示算子O出现在第ℓ层的概率,概率受前ℓ-1层架构的条件约束。它就像个"智能拼装盒",能自动根据问题难度挑选合适的智能体模块组合,既节省资源又高效。


2、智能体架构采样



MaAS框架通过一个控制器网络Qϕ接收查询q、参数化分布π和可用算子集,输出采样得到智能体架构G并执行,实现按需定制多智能体解决方案。具体来说:


  • 控制器网络接收查询q、参数化分布π和算子集,使用轻量级模型编码查询和算子描述;

  • 通过MoE式机制对每层的算子进行动态选择:综合当前查询语义和前序层算子聚合特征,计算所有可行算子相对于查询q的激活分数,按分数降序选择算子,直到累计分数超过阈值;

  • 简单查询可能仅需少量算子,因此,若某层采样到Oexit算子,立即终止后续层采样,减少冗余计算。


3、成本约束下的超网优化


此时的MaAS仍不是兼具成本与性能的最优解,需要基于环境反馈进行更新,具体优化目标如下:



p(⋅)评估多智能体系统的执行效果,C(⋅) 评估其成本(以Token消耗为指标),λ是权衡参数。


分布参数π的梯度:


由于智能体执行的过程通常涉及外部工具或基于API的LLM调用,导致其不可微,因此论文采用经验贝叶斯蒙特卡洛方法近似计算:



其中,权重mk结合了性能与成本,分布π的更新会倾向于选择那些能以最小Token成本生成高质量解决方案的多智能体系统。


算子O的梯度:


因算子包含黑盒工具和自然语言提示,使得传统数值梯度不可行,因此,论文引入基于智能体的文本梯度:



TP、TT、TN 分别表示由智能体生成的文本梯度分析,对应提示优化、温度调整和算子结构调整(如合并、拆分、修改等)。


通过这种方式,智能体超网的核心组件(即智能体算子及其连接方式)得以联合优化,从而实现多智能体系统的全自动演进。

2

实验


MaAS在所有任务领域均取得最优性能,经其优化的多智能体系统平均超越人工设计方法3.9%-6.4%和自动化方法2.07%-8.26%,展示了MaAS良好的通用性。



MaAS的优化过程资源友好。在各类优化导向的智能体工作流中,MaAS以最少的训练token消耗实现了最高准确率,且优化耗时最短。


MaAS的智能体超网在推理阶段展现出卓越的性价比,以较低的API成本、较少的token消耗和最短的耗时实现了最高准确率,这得益于其能根据查询难度动态分配资源的特性。



MaAS能够智能判断查询难度并动态调整架构:对简单查询(如a/b)在第二层便提前终止;复杂查询(如c/d)则自动增加处理层数。下图展示了每一层动态分配不同算子的能力。



  ✦   END  ✦  

 



 推荐阅读 


精调手机GUI智能体击败GPT-4o!腾讯AI Lab俞栋团队提出在线强化学习框架MobileGUI-RL

从提示词到 Function Calling:MCP 的前世今生

大模型Multi-Agent多智能体应用技术盘点

别再迷信 Agent 框架了,Context Engineering 才是王道

Manus创始人最新复盘:AI智能体上下文工程的6个经验教训




点击下方名片 即刻关注我们