【AI】ChatGPT智能体正式发布,多个创业赛道昨夜无眠
- 2025-07-24 08:00:00

实用,太实用了!这才是OpenAI Agent该有的样子。
就在刚刚,OpenAI最新发布来了,ChatGPT Agent正式对外亮相。
这是一个把“想”和“干”统一了的智能体,之前深度研究的思考和分析能力,Operator的操作执行能力,在ChatGPT Agent实现了统一。
而且ChatGPT Agent还可以接管你的整个电脑——这几乎就是全新的操作系统了。
能做什么?
工作场景里,安排和改期会议、生成PPT、制定出差和外出议程、自动提交报销……几乎就是大厂高管才能配置的助理的核心工作。
生活场景下,你个人的旅游行程规划设计、重大活动如婚礼晚宴安排……一些定期需要手动更新的认证证明……差不多也是董事长CEO们个人秘书实现的能力。

但现在,ChatGPT Agent一夜之间人人都可拥有。OpenAI还专门配备了专用模型,创造了全新的SOTA,刷新了模型能力新纪录。
之前,通用Agent们只敢自称“实习生”,但OpenAI在自研底层模型能力的底气下,几乎就把“实习生”变成了“大秘书”。之前一个创业赛道,分分钟变成了大厂产品里的一个功能按钮。
这也是ChatGPT Agent注定不会让所有人都开心的地方。
此前不论是在“想”还是“做”上做产品功能创新的Agent创业者,今夜难眠,又要被重新审视核心壁垒和竞争力了。
总之,把Operator和深度研究实现“二合一”的ChatGPT Agent,不止于1+1。
ChatGPT Agent详解:All in ONE
这次新发布,名字简单直接:ChatGPT Agent。
入口没有变——还是在原来页面「工具」下拉激活「智能体模式」即可。只是ChatGPT已经不再是以前的ChatGPT了,而是具备“Agent”能力的ChatGPT了。
具体如何做的?
就是将以往Operator的「网站交互」能力,DeepResearch这种「整合高质量信息」的能力,以及ChatGPT的对话能力等等,全部All in One,形成一个统一的智能体系统。
这样一来,能做的那就多了去了。
仅单一模型就可以主动与网站互动、筛选并获取最高效的结果。

比如它可以制作公司吉祥物漫画风贴纸,然后再订购500张并送到某个地址。
先整合搜索-再推理创作-再执行任务,一气呵成~

以往的浏览网页、制定行程、制作文档等各方面的体验,都实现了升维。
比如生成表格吧,它可以在这基础上保持原有格式的同时,用新的财务数据来随时更新表格。
不过这里有个华点,仔细看这个过程,它不是通过打开PPT插入文本框,而是编写代码生成一个看起来很像的表格。(Doge)

此外,你还可以设置固定时间执行,比如每周一生成周报啥的。
还有像规划并预订旅行行程,可以具体到某个环节的设计和预订,或者帮你寻找专业人士并安排预约。
他们强调,整个过程人类始终都掌握控制权,不仅可随时中断操作、接管浏览器或停止任务,它在执行重要操作前也会征得你的许可。
即日起,Pro、Plus 和Team版用户就可以感受到这种工作与生活的体验全面升维。
Pro版用户每月可执行400次任务,其他付费用户每月可发送40条消息,额外使用量可通过灵活的积分额度选项获取。
而企业版和教育版的用户将在几周之后获得使用权限。
免费等等党可以再蹲蹲,万一什么时候就有了呢。

不过需要明确的是,ChatGPT Agent也算不上全新的模型,而是与OpenAI o3还是属于一个家族。
这个模型经过了专门的训练,能够在执行任务时动态学习,通过优化速度、准确性和效率来调整其工作方式——
每个步骤中能识别并运用最适合的工具,通过评估结果而非固守固定方法来优化流程。
他们也还配备了所有可用的网络工具:通过图形用户界面与网络交互的可视化浏览器、用于简单推理型网络查询的文本浏览器,以及直接API访问权限。
有了不同的访问和交互路径,保证ChatGPT能够在推理与执行之间流程转换。
比如它可以快速通过API获取财务数据或体育赛事比分,同时也能与主要面向人类设计的网页进行视觉交互。
ChatGPT Agent在专门优化之后,相比于以往几个模型,网页浏览、执行现实世界任务能力方面实现了SOTA。
比如在「人类最后的考试」中,一举取得了41.6分。该测试集是出了名的超难,刚推出时无模型得分能超过10分。

在 DSBench 测试中,该测试旨在评估智能体在涵盖数据分析和建模等现实数据科学任务中的表现,ChatGPT智能体显著超越了之前的最先进模型。
尤其在数据分析任务中,其表现明显优于人类水平。

还有在SpreadsheetBench,同样实现了SOTA。
这个评测主要是用来评估模型处理真实场景中的电子表格编辑任务的表现。
结果ChatGPT Agent相比于GPT-4o提升了超过一倍。当具备直接编辑电子表格的能力时,ChatGPT Agent 的得分进一步提升至45.5%。

不过在最后,他们也强调了这个模型存在一定的风险。他们自己的“防范框架”将其定义为具有“放大现有严重危害途径”能力的模型。
虽然目前还没有直接证明,但他们已经有了些额外的安全措施,比如有个实时监视器,在每次回答前会判断这个问题有没有风险,比如生物相关,是否会给人类带来威胁;还有那种高风险的金融投资啊、敏感法律任务等等,都会主动拒绝。并且为了防止滥用,还禁用了记忆功能。
怎么看ChatGPT Agent带来的变革?
毫无疑问,ChatGPT Agent带来的变革,可能要比OpenAI之前的Agent试水要大得多深远得多。
Agent算是一个曾经科幻的概念,《钢铁侠》中的贾维斯,就是对Agent的“终极幻想”。
但AI Agent的推进,似乎又才刚刚开始。
在基础大模型能力不断强大之后,Agent开始被视为大模型应用的核心产品,Agent也成为了今年最热创新和创业赛道。
如果把视野拓展到企业级、工业级应用里,Agent的创新和发展就更早了。
AI客服实际就是最隐秘但又实际发展最快速的应用,而且带来的价值替代非常明显——现在找人工客服已经是相当困难了。
在AI客服之外,AI编程、AI绘图、AI PPT等垂直专用能力,也都在狂飙突进…
但更值得关注的是通用Agent的推进,即AI可以真正像人一样,接管你的上网甚至电脑。
OpenAI在这个方向推进上算是慢的。早在去年10月,Claude的母公司Anthropic就推出了名为“Computer Use”的工具,能够像人类一样使用电脑,“代表”用户完成任务。
如果只是“想”的层面,具体到撰写分析研究报告的Agent就更多了,海外有OpenAI、Google和Perplexity,国内则有秘塔、Kimi等等。
在手机端,华为、小米、OPPO、vivo和荣耀等等在内的公司,都在试水Agent,让AI自动帮你完成订咖啡、接推销电话——虽然那边也是AI打的,以及更多之前需要人自己“想”和“干”才能完成的工作。
而这就是趋势:一个全新的由AI贯穿始终的操作系统或者全新产品形态,正在汹涌而至。
如果保守来看,Agent会率先重塑如今互联网相关的一切,重塑我们互联网实现的对工作和生活的塑造。
PC时代的互联网核心塑造是“网站”,智能手机时代是“APP”,到了AI时代就是“Agent”。
PC互联网时代是千人一面,门户网站是其代表。
移动互联网时代可以千人千面,推荐算法下诞生了抖音Tiktok这样的全新超级应用。
那么Agent互联网时代呢?会有怎样全新的应用?又有谁会站上浪潮之巅?
问题还没有答案,但问题的答案,已经在被深度研究、自动执行了。
一键三连「点赞」「转发」「小心心」
欢迎在评论区留下你的想法!
— 完 —
☟☟☟
☞人工智能产业链联盟筹备组征集公告☜
☝
精选报告推荐:
11份清华大学的DeepSeek教程,全都给你打包好了,直接领取:
【清华第四版】DeepSeek+DeepResearch让科研像聊天一样简单?
【清华第七版】文科生零基础AI编程:快速提升想象力和实操能力
【清华第十一版】2025AI赋能教育:高考志愿填报工具使用指南
10份北京大学的DeepSeek教程
【北京大学第五版】Deepseek应用场景中需要关注的十个安全问题和防范措施
【北京大学第九版】AI+Agent与Agentic+AI的原理和应用洞察与未来展望
【北京大学第十版】DeepSeek在教育和学术领域的应用场景与案例(上中下合集)
8份浙江大学的DeepSeek专题系列教程
浙江大学DeepSeek专题系列一--吴飞:DeepSeek-回望AI三大主义与加强通识教育
浙江大学DeepSeek专题系列二--陈文智:Chatting or Acting-DeepSeek的突破边界与浙大先生的未来图景
浙江大学DeepSeek专题系列三--孙凌云:DeepSeek:智能时代的全面到来和人机协作的新常态
浙江大学DeepSeek专题系列四--王则可:DeepSeek模型优势:算力、成本角度解读
浙江大学DeepSeek专题系列五--陈静远:语言解码双生花:人类经验与AI算法的镜像之旅
浙江大学DeepSeek专题系列六--吴超:走向数字社会:从Deepseek到群体智慧
浙江大学DeepSeek专题系列七--朱朝阳:DeepSeek之火,可以燎原
浙江大学DeepSeek专题系列八--陈建海:DeepSeek的本地化部署与AI通识教育之未来
4份51CTO的《DeepSeek入门宝典》
51CTO:《DeepSeek入门宝典》:第1册-技术解析篇
51CTO:《DeepSeek入门宝典》:第2册-开发实战篇
51CTO:《DeepSeek入门宝典》:第3册-行业应用篇
51CTO:《DeepSeek入门宝典》:第4册-个人使用篇
5份厦门大学的DeepSeek教程
【厦门大学第一版】DeepSeek大模型概念、技术与应用实践
【厦门大学第五版】DeepSeek等大模型工具使用手册-实战篇
10份浙江大学的DeepSeek公开课第二季专题系列教程
【精选报告】浙江大学公开课第二季:《DeepSeek技术溯源及前沿探索》(附PDF下载)
【精选报告】浙江大学公开课第二季:2025从大模型、智能体到复杂AI应用系统的构建——以产业大脑为例(附PDF下载)
【精选报告】浙江大学公开课第二季:智能金融——AI驱动的金融变革(附PDF下载)
【精选报告】浙江大学公开课第二季:人工智能重塑科学与工程研究(附PDF下载)
【精选报告】浙江大学公开课第二季:生成式人工智能赋能智慧司法及相关思考(附PDF下载)
【精选报告】浙江大学公开课第二季:AI大模型如何破局传统医疗(附PDF下载)
【精选报告】浙江大学公开课第二季:2025年大模型:从单词接龙到行业落地报告(附PDF下载)
【精选报告】浙江大学公开课第二季:2025大小模型端云协同赋能人机交互报告(附PDF下载)
【精选报告】浙江大学公开课第二季:DeepSeek时代:让AI更懂中国文化的美与善(附PDF下载)
【精选报告】浙江大学公开课第二季:智能音乐生成:理解·反馈·融合(附PDF下载)
6份浙江大学的DeepSeek公开课第三季专题系列教程
【精选报告】浙江大学公开课第三季:走进海洋人工智能的未来(附PDF下载)
【精选报告】浙江大学公开课第三季:当艺术遇见AI:科艺融合的新探索(附PDF下载)
【精选报告】浙江大学公开课第三季:AI+BME,迈向智慧医疗健康——浙大的探索与实践(附PDF下载)
【精选报告】浙江大学公开课第三季:心理学与人工智能(附PDF下载)
【AI加油站】第八部:《模式识别(第四版)-模式识别与机器学习》(附下载)
人工智能产业链联盟高端社区

一次性说清楚DeepSeek,史上最全(建议收藏)
DeepSeek一分钟做一份PPT
用DeepSeek写爆款文章?自媒体人必看指南
【5分钟解锁DeepSeek王炸攻略】顶级AI玩法,解锁办公+创作新境界!
【中国风动漫】《雾山五行》大火,却很少人知道它的前身《岁城璃心》一个拿着十米大刀的男主夭折!

免责声明:部分文章和信息来源于互联网,不代表本订阅号赞同其观点和对其真实性负责。如转载内容涉及版权等问题,请立即与小编联系(微信号:913572853),我们将迅速采取适当的措施。本订阅号原创内容,转载需授权,并注明作者和出处。如需投稿请与小助理联系(微信号:AI480908961)
编辑:Zero





- 点赞 (0)
-
分享
微信扫一扫
-
加入群聊
扫码加入群聊