金磊 假装发自 纽约
量子位 | 公众号 QbitAI

80分钟的一场活动,Agent的“出镜次数”竟能高达217次。

解锁平均20多秒就提一次Agent的,正是云计算一哥,亚马逊云科技

为何会如此?

因为就在刚刚的纽约峰会上,亚马逊云科技可以说是重新定义了部署AI Agent到生产环境中的方式——

正式发布Amazon Bedrock AgentCore,一个企业级的AI Agent搭建工具包。

如果说以往的AI Agent要部署到实际生产中,其结果更像是一个“毛坯房”,其间有太多问题亟需解决。

比如你想开发一个智能客服、个人助手或者业务流程自动化工具,这个过程都需要整合大语言模型、连接数据库、调用各种API,并让系统能够智能决策。

AgentCore就像是为这些应用提供的“智能大脑”,可以帮你统一管理和协调所有组件,让复杂的AI应用开发变得简单高效。

之前的Amazon Bedrock提供的能力更加聚焦在基础大模型本身,比如调用Claude、Meta、Nova、Mistral等大模型,有点类似于“租用大脑”。

而AgentCore则是在这个基础上提供一个“智能体搭建工具包”,让你能把这些大脑组合起来完成具体任务。

具体而言,它是涵盖7大核心服务的一套组合拳,把部署AI Agent到生产过程中的各种细节内容都照顾到位了,有一种直接“拎包入住精装房”的感觉:

  • AgentCore Runtime:

提供低延迟的无服务器环境,支持会话隔离,兼容任何代理框架(包括开源框架),能够处理多模态工作负载和长期运行的Agent。通过AgentCore SDK在代码中添加几行代码,指定入口点函数,即可将代理部署到云端。

  • AgentCore Memory:

管理会话和长期记忆,为模型提供上下文信息,帮助Agent从过去的交互中学习。对于短期记忆,通过create_event存储Agent交互,通过list_events加载最近的对话内容;对于长期记忆,支持语义记忆策略(如用户偏好、总结和事实捕获),数据以加密形式存储,并支持基于命名空间的数据分割。

  • AgentCore Observability:

提供代理执行的逐步可视化,包括元数据标记、自定义评分、轨迹检查和故障排除/调试过滤器。可以帮助开发者调试、审计和监控Agent性能,内置仪表板用于跟踪关键操作指标(如会话数、延迟、错误率等),支持OpenTelemetry以集成现有可观测性平台。

  • AgentCore Identity:

使AI Agent能够安全地访问亚马逊云科技服务和第三方工具(如GitHub、Salesforce、Slack),支持基于用户身份或预授权用户同意的操作。通过创建工作负载身份和凭证提供者(如OAuth2、API密钥),Agent可以使用这些凭证安全地访问资源。

  • AgentCore Gateway:

将现有的API和Lambda函数转换为可用于代理的工具,提供跨协议(包括MCP)的统一访问和运行时发现,提供双重身份验证模型以确保安全。

  • AgentCore Browser:

提供托管的网页浏览器实例,扩展Agent的Web自动化工作流。可以用于访问没有程序化API的系统或需要通过Web界面访问的资源。

  • AgentCore Code Interpreter:

提供隔离环境以运行代理生成的代码。用于执行需要计算的任务,例如客户支持Agent需要进行的计算。

这些服务既可以单独使用,也经过优化能够无缝协作,开发者不用再花时间去拼凑各种组件了。

AgentCore是首个提供完全开发灵活性的企业级无服务器AI代理运行时平台,支持任何框架、模型和协议,具备8小时工作负载支持、严格安全边界和按需付费的可组合服务架构。

一言蔽之,再大规模的AI Agent,现在AgentCore这里,都可以安全操作和部署。

由此作为最为关键的发布,亚马逊云科技在今天的活动中,不论是在基础设施、模型架构,亦或是应用上,均围绕着Agent来展开。

之所以如此,亚马逊云科技Agentic AI副总裁Swami Sivasubramanian的话来说就是:

未来的关键在于让所有Agents和工具协同工作。

不仅要方便,还要够靠谱

为了更方便操作,基于AgentCore,亚马逊云科技还推出了Marketplace中的AI Agents和工具,只需要通过自然语言搜索,客户就可以轻松描述使用场景并找到相关解决方案(目前已经有数百种)。

除此之外,亚马逊云科技在Amazon SageMaker AI中还推出了Amazon Nova定制化的功能。

客户现在可以在模型训练生命周期中对Nova Micro、Nova Lite和Nova Pro进行定制,包括预训练、监督微调和对齐。

据了解,这些技术作为现成的Amazon SageMaker配方提供,并支持无缝部署到Amazon Bedrock,满足按需和预置吞吐量推理的需求。

针对AI Agent许多功能过分依赖API的问题,亚马逊云科技还推出了Amazon Nova Act来打破这一局限——

创建能够在网页浏览器中执行任务的AI Agent。

与此同时,亚马逊云科技一道还发布了Amazon Nova Act SDK的研究预览版,用这个SDK,开发者就可以很方便地创建能够自动执行网页任务的AI Agent。

为了进一步提高准确性,SDK支持通过Playwright进行浏览器操作、API调用、Python集成以及并行线程处理,以克服网页加载延迟。

在内部评估中,Amazon Nova Act针对特定能力取得了超过90%的高分,例如在ScreenSpot Web文本基准测试中得分0.939。

由此可见,亚马逊云科技在打造AI Agent这件事上,不仅追求可用度,更加注重可靠性。

数据库也很AI Agent

亚马逊云科技针对AI Agent这个主旋律,还在数据层上下足了功夫。

众所周知,向量(Vectors)可以说是AI的语言,它可以把文字、图像等内容转成大模型能理解的数字格式。

对于现代企业来说,AI Agent将向量用于两个关键功能,一个是用于从过去的互动中构建上下文,另一个是发现海量数据集中的相似性内容。

但现在面临的一个问题是,目前的知识、数据规模变得越来越大,它们不再仅仅是临时资源,更是必须长期保存的战略资源。

为此,亚马逊云科技推出了Amazon S3 Vectors——首个原生支持存储大规模向量数据集、并提供亚秒级查询性能的云对象存储服务。

它最大的亮点,就是直接把上传、存储和查询向量的总成本降低多达90%!

从技术角度来看,S3 Vectors推出了一种叫“向量桶”(vector buckets)的新存储类型,它有专门的API接口,让我们可以存储、访问和查询向量数据,而且不需要自己搭建任何基础设施。

当创建一个S3向量桶时,我们的向量数据会被组织在“向量索引”(vector index)中,这样就能很简单地对数据集进行相似性搜索。

据了解,每个向量桶最多可以有10000个向量索引,每个向量索引可以存储数千万个向量。

在创建向量索引后,当我们往索引里添加向量数据时,还可以给每个向量附加一些元数据(以键值对的形式),这样一来查询时就能根据特定条件进行过滤,比如按日期、类别或用户偏好来筛选。

随着时间推移,当你对向量进行写入、更新和删除操作时,S3 Vectors会自动优化这些向量数据,确保在向量存储方面达到最佳的性价比,即使数据集规模不断扩大和变化也是如此。

S3 Vectors还与Amazon Bedrock Knowledge Bases(包括Amazon SageMaker Unified Studio)原生集成,用于构建成本效益高的检索增强生成(RAG)应用。

通过与Amazon OpenSearch Service的集成,我们可以把不常查询的向量放在S3 Vectors中来降低存储成本,然后在需求增加时快速将它们转移到OpenSearch,或者用于支持实时、低延迟的搜索操作。

亚马逊云科技的AI Agent之道,已经改变了AI编程

除了基础设施和模型层面之外,亚马逊云科技在应用上还拿出了一款全新的免费AI编程工具,Kiro

若是用一句话概括Kiro的亮点,那就是只要你有想法,它就能帮你把这个想法变成实际可用的软件,而且是从项目启动、设计、编程到最终维护,全程都有专业级的Agent深度参与。

例如我们要给电商网站添加一个评论系统,现在就只需要三步即可。

第一步,把一句话需求变成详细计划:

为产品添加评论系统。

可以看到,Kiro秒懂了你的意图,马上把这句简单的话,分解成一个个具体的用户场景和需求。

比如,它会想到“用户要能看评论”、“用户要能写评论”、“用户可以筛选评论”、“用户可以给评论打分”等等。

并且,Kiro会把每个需求的验收标准都写得清清楚楚,就像一份详细的需求文档,避免了后续理解上的偏差。

第二步,根据计划自动生成“施工图纸”。

在咱们确认了第一步的需求计划后,Kiro就会自己去研究现有的项目代码;然后,它会自动生成一份技术“施工图纸”。

这份图纸非常专业,包括数据怎么流动、需要哪些新的数据接口和数据库设计等等。

比如,它会设计好“评论”这个东西具体应该包含哪些信息(如评论内容、评分、用户ID等)。

第三步,把“图纸”变成一个个具体的“施工任务”。

在这个步骤中,Kiro会根据上一步的“施工图纸”,把整个开发工作拆分成一个个小任务,并且按照“先做什么后做什么”的依赖关系排好顺序。

每个小任务都写得非常具体,比如“写单元测试”、“做集成测试”、“考虑加载时的页面状态”、“适配手机版”、“保证无障碍使用”等等。

或许此时你就要问了,Kiro和其它的编程AI有什么区别?

其实从刚才的展示过程中应该也能或多或少地感受到,在亚马逊云科技开辟的AI Agent新生产范式之下,正如网友所说:

Kiro规范化了AI编程的工作流程。

以上便是此次发布的主要内容了,整体来看,亚马逊云科技再一次从基础设施、模型框架以及应用三个层面来了个“大焕新”,而这一次的主角,毫无疑问就是AI Agent。

而这一切,所影射的实则是云计算一哥下的一盘大棋。

Why AI Agent?Why 亚马逊云科技?

对于第一个问题,若是用Swami Sivasubramanian在现场所陈述的愿景来解释,那就是:

让亚马逊云科技成为构建世界上最有用的AI Agents的最佳场所。

在亚马逊云科技看来,AI Agent的意义不仅仅是一个技术概念,更是企业组织效率的跃迁工具。

借助Agentic AI,企业可以将重复性强、逻辑明确的任务交由智能体完成,让员工专注于更具创造力与战略性的事务。

通过AI Agent,亚马逊云科技可以帮助客户简化流程、提升响应速度,并释放团队潜能,从而改变业务运作方式。

而纵观今天所有的新发布,虽然它们的细分功能各有侧重,但小目标均是剑指于此。

例如为了让更多企业快速找到、试用并部署Agent,亚马逊云科技在其Marketplace市场中新增了“AI Agents & Tools”分类。

再如为了解决许多AI Agent只能停留在原型验证阶段,缺乏可扩展性与安全保障的问题,亚马逊云科技推出的Amazon Bedrock AgentCore就专门为生产级AI Agent而设计。

以及面向开发者,诸如Kiro这样的AI编程应用,更是重新规范了AI Agent在编程任务中的流程,目标依旧是能够保障“生产级”。

如此考量的背后,也有市场发展的预期所支撑。根据最新调查数据,AI Agents正迅速成为企业主流应用。

LangChain调查显示,超过50%的公司已在生产环境中部署agent,近80%正在开发中。Gartner预测到2028年,33%的企业软件将包含Agentic AI(相比2024年不到1%),15%的日常工作决策将由其自主完成,并将取代20%的人类店面互动。

企业更青睐能查询多个任务特定模型的Agentic AI功能而非单一基础模型,这种多语言模型方法具有更强的跨领域扩展性。目前,软件开发、客户服务、理赔处理和IT流程自动化是Agentic AI的主要早期应用场景。

并且从技术发展的角度来看,目前几乎所有的生成式AI产品或应用,均离不开AI Agent这个关键词。

由此,就不难理解为什么亚马逊云科技如此关注AI Agent了,正如CEO Matt Garman所说:

AI Agent将改变我们所有人的工作和生活方式,其影响力堪比互联网的诞生。

大趋势已经指向AI Agent,科技巨头又以“all in”之势发力于此,双重认证之下已然证明了AI Agent的重要性;但更重要的一点是,云计算一哥已然给业界交付了“快好省”投入生产的新范式。

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!

—  —

🌟 点亮星标 🌟

科技前沿进展每日见