GenFlow 2.0 要来了，这可能是一个和所有Agent都不同的产品｜WAIC2025

从 OpenAI、字节跳动，到一众创业团队，今年几乎所有 AI 公司都在推进自己的 Agent 战略：有人做工具执行器，有人做工作流代理，有人主打插件调度，有人想做全能副驾……

在这场尚未定型的「Agent 大战」里，百度也选择了自己的切入方式，从内容创作工具出发，用一个更「擅长干活」的智能体系统来回应实际用户的使用场景。

在今年的 WAIC 2025 上，百度文库预告了全新升级的 GenFlow 2.0，一个打包了模型调度、多智能体协作、主动干预与全链路内容交付的「通用 Agent 平台」。

它的出现，标志着「AI 帮你干活」这件事，正式进入了协作化、多模态、高并发的新阶段。

相比于 4 月份发布的 GenFlow 1.0，百度文库这一次将战线拉到了「通用智能体操作系统」的高度，不仅能接住你的模糊指令，自主调用各种模型和数百个多模态 Agent，更是提出了一个极具野心的目标。

「一个入口，N 种模式，无所不能」。

目前，GenFlow 2.0 还未正式发布，APPSO 获悉预计将于 8 月面向全体用户开放。

GenFlow 2.0 的关键升级点：六种模式切换

从百度的设计理念来看，GenFlow 2.0 想解决的不是「AI 不够聪明」，而是「AI 不够协作」。

在用户侧，它提供了一个统一的入口，用户只需输入一句自然语言指令，就可以由系统自动规划任务，调用不同类型的 Agent 同步执行，生成 PPT、报告、网页、动画、图表等多模态内容。

官方将这种方式称为「通用多智能体协作调度」，强调每个子任务由不同 Agent 并行完成，而不是一个大模型串行处理所有请求。

这种架构思路在此前的 GenFlow 1.0 中已有所展现，新版本则进一步引入了更细化的协作模式。

你可以把它想象成一个 AI 协作团队，有人做内容，有人做图表，有人做排版，有人懂你的过往历史，还有人给结果「擦屁股」做最后润色。GenFlow 2.0 就像是在操作一整个内容流水线。

这背后依赖的是百度文库最新上线的沧舟 OS + MCP 模型调度系统，为多模态 Agent 的并发与高效协作提供了基础设施。

引入的六种智能体协作模式，试图适配从轻量查询到复杂内容生成的不同场景。

最基础的是简单模式，用于快速返回直接答案，比如「8 月上海有哪些演唱会」， GenFlow 2会直接给出答案，提升交互体验。

而面对需要图文多模态生成的任务，系统会切换到通用模式，自动调度多个 Agent 协同生成内容。

如果用户曾使用过百度文库、百度网盘，记忆模式则能基于过往对话、网盘文件等提供个性化补全；像是如果输入「我们上次做的那份报告」，GenFlow 2.0 也能被准确理解和调用。

处理复杂任务时，并行模式可同步启动多个 Agent，各自负责不同子任务，大幅缩短交付时间。同时，用户在生成中可随时调整需求，而干预模式支持「边生成边修改」；在更高复杂度场景下，系统还会进入深度模式，灵活组合以上能力，系统性完成交付。

记忆模式和并行模式都是 GenFlow 2.0 的首创。

这些模式的组合带来了显著的使用体验跃迁：一句话丢给 GenFlow，不再是等一个模型返回一份内容，而是触发一整套系统开始「动脑、动手、动工具」，最后生成内容翔实、格式丰富、风格统一的可编辑内容。

相比其他 Agent 产品，GenFlow 2.0 补了这些「现实的坑」

GenFlow 2.0 的定位，与目前市面上正在开发或测试的多款智能体产品形成了对照，比如 OpenAI 的 ChatGPT Agent、Kimi K2、Manus、MiniMax 等。

从百度方面公开的信息来看，GenFlow 2.0 目前强调的几个差异点主要集中在：

任务执行的「并发性」：不靠一个模型多轮调用，而是多个 Agent 同步工作，目标是减少等待时间。

中文语境下的信息检索能力：背靠百度文库 14 亿文档和百度学术 6.8 亿篇文献，内容生成更贴近中文用户的语料系统。

个性化程度：通过网盘数据、聊天记录等历史行为建立「记忆库」，尝试更长线地理解用户。

可编辑性：生成结果不是「最终答案」，而是可修改的中间稿，依托百度融合编辑器支持继续打磨。

当然，目前这些能力多是基于演示视频和官方说明呈现，后续真实交付效果还需观察。但从产品思路上，GenFlow 明显在「内容生产工具化」这条路上做了更深的系统化尝试。

GenFlow 2.0 在深度模式下完成手机信息查询及整理总结

GenFlow 2.0 在并行模式下设计手办盲盒

官方给出的 GenFlow 2.0 演示项目里，使用它完成了物理备课、研究报告、校招宣讲、绘本制作等多个场景的交付能力。

一个 Agent 能不能搞定？也许更重要的是协作方式

GenFlow 本质上是一次对「通用 Agent」的落地探索，它的特别之处，在于：

通用不是一个模型通用，而是一整套 Agent 分工合作的能力通用；

调度不仅发生在内容生成阶段，更包含编辑、检索、个人记忆的上下链协作；

它不仅懂你说什么，还懂你「说过什么」，系统记住你的风格、偏好与习惯。

WAIC 百度展台现场

百度文库显然是想用 GenFlow 2.0，率先打造出中国语境下真正可用、可商用、可协作的 AI 助理产品，未来也许会走向全场景智能办公平台、企业级交付工具，甚至是基于 Agent 的工作流操作系统。

而它的野心，其实藏在那句口号里：

一个入口，N 种模式，无所不能。

GenFlow 2.0 的万能，大概就在于更高效、更贴合场景。

目前，GenFlow 2.0 尚在测试阶段，最终体验效果和适用边界仍待 8 月份正式上线后验证。但它所呈现出的多智能体并行调度框架，确实为当前 Agent 领域提供了一个结构上不同的解法。

APPSO 也会在新版本上线后第一时间带来上手体验和具体评测，继续关注它在真实场景中的落地表现。

WAIC 2025 APPSO 在现场，欢迎加入社群一起畅聊 AI 产品，获取#AI有用功，解锁更多 AI 新知👇

声明：本文内容及配图由入驻作者撰写或合作网站授权转载。文章观点仅代表作者本人，不代表科技区角网立场。仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。点击这里