云计算一哥，刚刚重新定义了AI Agent的玩法

量子位
2025-07-17 14:00:00

金磊假装发自纽约
量子位 | 公众号 QbitAI

80分钟的一场活动，Agent的“出镜次数”竟能高达217次。

解锁平均20多秒就提一次Agent的，正是云计算一哥，亚马逊云科技。

为何会如此？

因为就在刚刚的纽约峰会上，亚马逊云科技可以说是重新定义了部署AI Agent到生产环境中的方式——

正式发布Amazon Bedrock AgentCore，一个企业级的AI Agent搭建工具包。

如果说以往的AI Agent要部署到实际生产中，其结果更像是一个“毛坯房”，其间有太多问题亟需解决。

比如你想开发一个智能客服、个人助手或者业务流程自动化工具，这个过程都需要整合大语言模型、连接数据库、调用各种API，并让系统能够智能决策。

AgentCore就像是为这些应用提供的“智能大脑”，可以帮你统一管理和协调所有组件，让复杂的AI应用开发变得简单高效。

之前的Amazon Bedrock提供的能力更加聚焦在基础大模型本身，比如调用Claude、Meta、Nova、Mistral等大模型，有点类似于“租用大脑”。

而AgentCore则是在这个基础上提供一个“智能体搭建工具包”，让你能把这些大脑组合起来完成具体任务。

具体而言，它是涵盖7大核心服务的一套组合拳，把部署AI Agent到生产过程中的各种细节内容都照顾到位了，有一种直接“拎包入住精装房”的感觉：

AgentCore Runtime：

提供低延迟的无服务器环境，支持会话隔离，兼容任何代理框架（包括开源框架），能够处理多模态工作负载和长期运行的Agent。通过AgentCore SDK在代码中添加几行代码，指定入口点函数，即可将代理部署到云端。

AgentCore Memory：

管理会话和长期记忆，为模型提供上下文信息，帮助Agent从过去的交互中学习。对于短期记忆，通过create_event存储Agent交互，通过list_events加载最近的对话内容；对于长期记忆，支持语义记忆策略（如用户偏好、总结和事实捕获），数据以加密形式存储，并支持基于命名空间的数据分割。

AgentCore Observability：

提供代理执行的逐步可视化，包括元数据标记、自定义评分、轨迹检查和故障排除/调试过滤器。可以帮助开发者调试、审计和监控Agent性能，内置仪表板用于跟踪关键操作指标（如会话数、延迟、错误率等），支持OpenTelemetry以集成现有可观测性平台。

AgentCore Identity：

使AI Agent能够安全地访问亚马逊云科技服务和第三方工具（如GitHub、Salesforce、Slack），支持基于用户身份或预授权用户同意的操作。通过创建工作负载身份和凭证提供者（如OAuth2、API密钥），Agent可以使用这些凭证安全地访问资源。

AgentCore Gateway：

将现有的API和Lambda函数转换为可用于代理的工具，提供跨协议（包括MCP）的统一访问和运行时发现，提供双重身份验证模型以确保安全。

AgentCore Browser：

提供托管的网页浏览器实例，扩展Agent的Web自动化工作流。可以用于访问没有程序化API的系统或需要通过Web界面访问的资源。

AgentCore Code Interpreter：

提供隔离环境以运行代理生成的代码。用于执行需要计算的任务，例如客户支持Agent需要进行的计算。

这些服务既可以单独使用，也经过优化能够无缝协作，开发者不用再花时间去拼凑各种组件了。

AgentCore是首个提供完全开发灵活性的企业级无服务器AI代理运行时平台，支持任何框架、模型和协议，具备8小时工作负载支持、严格安全边界和按需付费的可组合服务架构。

一言蔽之，再大规模的AI Agent，现在AgentCore这里，都可以安全操作和部署。

由此作为最为关键的发布，亚马逊云科技在今天的活动中，不论是在基础设施、模型架构，亦或是应用上，均围绕着Agent来展开。

之所以如此，亚马逊云科技Agentic AI副总裁Swami Sivasubramanian的话来说就是：

未来的关键在于让所有Agents和工具协同工作。

不仅要方便，还要够靠谱

为了更方便操作，基于AgentCore，亚马逊云科技还推出了Marketplace中的AI Agents和工具，只需要通过自然语言搜索，客户就可以轻松描述使用场景并找到相关解决方案（目前已经有数百种）。

除此之外，亚马逊云科技在Amazon SageMaker AI中还推出了Amazon Nova定制化的功能。

客户现在可以在模型训练生命周期中对Nova Micro、Nova Lite和Nova Pro进行定制，包括预训练、监督微调和对齐。

据了解，这些技术作为现成的Amazon SageMaker配方提供，并支持无缝部署到Amazon Bedrock，满足按需和预置吞吐量推理的需求。

针对AI Agent许多功能过分依赖API的问题，亚马逊云科技还推出了Amazon Nova Act来打破这一局限——

创建能够在网页浏览器中执行任务的AI Agent。

与此同时，亚马逊云科技一道还发布了Amazon Nova Act SDK的研究预览版，用这个SDK，开发者就可以很方便地创建能够自动执行网页任务的AI Agent。

为了进一步提高准确性，SDK支持通过Playwright进行浏览器操作、API调用、Python集成以及并行线程处理，以克服网页加载延迟。

在内部评估中，Amazon Nova Act针对特定能力取得了超过90%的高分，例如在ScreenSpot Web文本基准测试中得分0.939。

由此可见，亚马逊云科技在打造AI Agent这件事上，不仅追求可用度，更加注重可靠性。

数据库也很AI Agent

亚马逊云科技针对AI Agent这个主旋律，还在数据层上下足了功夫。

众所周知，向量（Vectors）可以说是AI的语言，它可以把文字、图像等内容转成大模型能理解的数字格式。

对于现代企业来说，AI Agent将向量用于两个关键功能，一个是用于从过去的互动中构建上下文，另一个是发现海量数据集中的相似性内容。

但现在面临的一个问题是，目前的知识、数据规模变得越来越大，它们不再仅仅是临时资源，更是必须长期保存的战略资源。

为此，亚马逊云科技推出了Amazon S3 Vectors——首个原生支持存储大规模向量数据集、并提供亚秒级查询性能的云对象存储服务。

它最大的亮点，就是直接把上传、存储和查询向量的总成本降低多达90%！

从技术角度来看，S3 Vectors推出了一种叫“向量桶”（vector buckets）的新存储类型，它有专门的API接口，让我们可以存储、访问和查询向量数据，而且不需要自己搭建任何基础设施。

当创建一个S3向量桶时，我们的向量数据会被组织在“向量索引”（vector index）中，这样就能很简单地对数据集进行相似性搜索。

据了解，每个向量桶最多可以有10000个向量索引，每个向量索引可以存储数千万个向量。

在创建向量索引后，当我们往索引里添加向量数据时，还可以给每个向量附加一些元数据（以键值对的形式），这样一来查询时就能根据特定条件进行过滤，比如按日期、类别或用户偏好来筛选。

随着时间推移，当你对向量进行写入、更新和删除操作时，S3 Vectors会自动优化这些向量数据，确保在向量存储方面达到最佳的性价比，即使数据集规模不断扩大和变化也是如此。

S3 Vectors还与Amazon Bedrock Knowledge Bases（包括Amazon SageMaker Unified Studio）原生集成，用于构建成本效益高的检索增强生成（RAG）应用。

通过与Amazon OpenSearch Service的集成，我们可以把不常查询的向量放在S3 Vectors中来降低存储成本，然后在需求增加时快速将它们转移到OpenSearch，或者用于支持实时、低延迟的搜索操作。

亚马逊云科技的AI Agent之道，已经改变了AI编程

除了基础设施和模型层面之外，亚马逊云科技在应用上还拿出了一款全新的免费AI编程工具，Kiro。

若是用一句话概括Kiro的亮点，那就是只要你有想法，它就能帮你把这个想法变成实际可用的软件，而且是从项目启动、设计、编程到最终维护，全程都有专业级的Agent深度参与。

例如我们要给电商网站添加一个评论系统，现在就只需要三步即可。

第一步，把一句话需求变成详细计划：

为产品添加评论系统。

可以看到，Kiro秒懂了你的意图，马上把这句简单的话，分解成一个个具体的用户场景和需求。

比如，它会想到“用户要能看评论”、“用户要能写评论”、“用户可以筛选评论”、“用户可以给评论打分”等等。

并且，Kiro会把每个需求的验收标准都写得清清楚楚，就像一份详细的需求文档，避免了后续理解上的偏差。

第二步，根据计划自动生成“施工图纸”。

在咱们确认了第一步的需求计划后，Kiro就会自己去研究现有的项目代码；然后，它会自动生成一份技术“施工图纸”。

这份图纸非常专业，包括数据怎么流动、需要哪些新的数据接口和数据库设计等等。

比如，它会设计好“评论”这个东西具体应该包含哪些信息（如评论内容、评分、用户ID等）。

第三步，把“图纸”变成一个个具体的“施工任务”。

在这个步骤中，Kiro会根据上一步的“施工图纸”，把整个开发工作拆分成一个个小任务，并且按照“先做什么后做什么”的依赖关系排好顺序。

每个小任务都写得非常具体，比如“写单元测试”、“做集成测试”、“考虑加载时的页面状态”、“适配手机版”、“保证无障碍使用”等等。

或许此时你就要问了，Kiro和其它的编程AI有什么区别？

其实从刚才的展示过程中应该也能或多或少地感受到，在亚马逊云科技开辟的AI Agent新生产范式之下，正如网友所说：

Kiro规范化了AI编程的工作流程。

以上便是此次发布的主要内容了，整体来看，亚马逊云科技再一次从基础设施、模型框架以及应用三个层面来了个“大焕新”，而这一次的主角，毫无疑问就是AI Agent。

而这一切，所影射的实则是云计算一哥下的一盘大棋。

Why AI Agent？Why 亚马逊云科技？

对于第一个问题，若是用Swami Sivasubramanian在现场所陈述的愿景来解释，那就是：

让亚马逊云科技成为构建世界上最有用的AI Agents的最佳场所。

在亚马逊云科技看来，AI Agent的意义不仅仅是一个技术概念，更是企业组织效率的跃迁工具。

借助Agentic AI，企业可以将重复性强、逻辑明确的任务交由智能体完成，让员工专注于更具创造力与战略性的事务。

通过AI Agent，亚马逊云科技可以帮助客户简化流程、提升响应速度，并释放团队潜能，从而改变业务运作方式。

而纵观今天所有的新发布，虽然它们的细分功能各有侧重，但小目标均是剑指于此。

例如为了让更多企业快速找到、试用并部署Agent，亚马逊云科技在其Marketplace市场中新增了“AI Agents & Tools”分类。

再如为了解决许多AI Agent只能停留在原型验证阶段，缺乏可扩展性与安全保障的问题，亚马逊云科技推出的Amazon Bedrock AgentCore就专门为生产级AI Agent而设计。

以及面向开发者，诸如Kiro这样的AI编程应用，更是重新规范了AI Agent在编程任务中的流程，目标依旧是能够保障“生产级”。

如此考量的背后，也有市场发展的预期所支撑。根据最新调查数据，AI Agents正迅速成为企业主流应用。

LangChain调查显示，超过50%的公司已在生产环境中部署agent，近80%正在开发中。Gartner预测到2028年，33%的企业软件将包含Agentic AI（相比2024年不到1%），15%的日常工作决策将由其自主完成，并将取代20%的人类店面互动。

企业更青睐能查询多个任务特定模型的Agentic AI功能而非单一基础模型，这种多语言模型方法具有更强的跨领域扩展性。目前，软件开发、客户服务、理赔处理和IT流程自动化是Agentic AI的主要早期应用场景。

并且从技术发展的角度来看，目前几乎所有的生成式AI产品或应用，均离不开AI Agent这个关键词。

由此，就不难理解为什么亚马逊云科技如此关注AI Agent了，正如CEO Matt Garman所说：

AI Agent将改变我们所有人的工作和生活方式，其影响力堪比互联网的诞生。

大趋势已经指向AI Agent，科技巨头又以“all in”之势发力于此，双重认证之下已然证明了AI Agent的重要性；但更重要的一点是，云计算一哥已然给业界交付了“快好省”投入生产的新范式。

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法！

— 完 —

🌟 点亮星标 🌟

科技前沿进展每日见

AI
云计算

声明：本文内容及配图由入驻作者撰写或合作网站授权转载。文章观点仅代表作者本人，不代表科技区角网立场。仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。点击这里

点赞 0
分享
微信扫一扫
加入群聊
扫码加入群聊

金磊 假装发自 纽约量子位 | 公众号 QbitAI

不仅要方便，还要够靠谱

数据库也很AI Agent

亚马逊云科技的AI Agent之道，已经改变了AI编程

Why AI Agent？Why 亚马逊云科技？

金磊假装发自纽约
量子位 | 公众号 QbitAI