GPT-5发布倒计时,纽约大学教授Gary Marcus泼来7盆冷水,「GPT-5会很惊艳,但依旧愚蠢」
- 2025-07-28 15:34:53
编者按:在全网热切期盼 GPT-5 的浪潮中,我们为何要分享一篇泼冷水的文章?因为 AI 领域的领军人物 Gary Marcus 提供了一个至关重要的理性视角。他犀利地指出,尽管技术日新月异,但其底层核心挑战依旧严峻。
我们相信,真正的进步源于清醒的认知。希望此文能助您超越喧嚣,看清 AI 发展的真实路径,在思考中获得独特的洞见与启发。
GARY MARCUS
2025年7月28日
多年以来,我们总在没完没了地听说 GPT-5 即将发布,但这些预测一次又一次地落空。
但这一次,我认为 GPT-5 真的要来了,这并非玩笑。
GPT-5 必定会比 GPT-4 更出色,甚至出色得多。我敢保证,它的出现将再次震撼世人,让 GPT-4 完全相形见绌。
尽管如此,我仍有七个不那么乐观的预测。
GPT-5 仍会像它的前辈一样,像一头闯入瓷器店的公牛,行事鲁莽且难以驾驭。它依然会犯下大量令人匪夷所思的低级错误,而这些错误的出现方式将难以预测。很多时候它能按你的意愿行事,但有时却不能——而你依然很难提前判断究竟会是哪种情况。
在物理、心理和数学世界的推理能力上,它将依然不可靠。GPT-5 也许能解决许多先前基准测试中的特定项目,但在更长、更复杂的场景中,它仍然会漏洞百出。
幻觉仍将是家常便饭,并且很容易被诱发。这将继续加剧一个风险:大语言模型被用作制造以假乱真的虚假信息的强大工具。系统内置的护栏机制,也将在形同虚设与过度严苛之间摇摆不定,难以找到平衡。
它的自然语言输出,依旧无法稳定地与下游的应用程序对接。例如,你无法简单地将其连接到数据库或虚拟助手,并期望获得可预测的、可靠的结果。构建虚拟助手和智能体的开发者会发现,他们仍然无法足够可靠地将用户的语言,精确映射到用户的真实意图上。
GPT-5 本身,并不会是能够胜任一切任务的通用人工智能。没有外部工具的辅助,它在《外交风云》中赢不了 Meta 的 Cicero,无法可靠地驾驶汽车,也无法引导像 Optimus 这样的机器人变得像科幻作品中那样无所不能。它的本质,仍是一个涡轮增压版的“风格模仿大师”,一个用于头脑风暴和撰写初稿的绝佳工具,但绝非值得信赖的通用智能。
人类期望与机器行为之间的对齐问题,仍将是一个悬而未决的核心难题。系统依然无法确保其输出能严格遵循一套围绕有益、无害、真实的共同人类价值观。其内在的隐藏偏见,在发布后的数天或数月内就会被曝光。它提供的某些建议,甚至会糟糕到让人匪夷所思。
当通用人工智能真正到来时,回过头看,像 GPT-5 这样的大语言模型,或许会被视为最终解决方案的一部分,但仅仅是其中的一小部分。单靠规模化——也就是无尽地构建更大模型直至吞噬整个互联网——这种路径的有效性将被证明是有限的。
真正值得信赖、与人类价值观对齐的通用人工智能,将源于那些结构更强、知识更扎实的系统。这些未来的系统,将包含目前大语言模型所缺乏的、用于推理和规划的显式工具与知识体系。
十年之内,甚至可能更快,人工智能领域的焦点将从对大语言模型的盲目崇拜,转移到如何将它们与其它众多技术进行深度融合上。在 2043 年的历史回眸中,思想史学家们会得出结论:我们曾一度过度迷恋大语言模型,但最终,行业的钟摆还是逐渐、但又至关重要地,摆回到了追求更深层理解的结构化系统。
如果这七个预测最终都被证实,我希望整个领域能最终意识到:是时候翻篇了。
闪亮的新事物总是让人着迷,我也完全相信 GPT-5 会是迄今为止最闪亮的那一个。但这并不意味着,它就是通往可信赖人工智能的最佳路径上的关键一步。
我预测,要实现那一目标,我们需要的是真正全新的、将显式知识和世界模型根植于其核心的系统架构。
一键三连「点赞」「转发」「小心心」
欢迎在评论区留下你的想法!

- 点赞 (0)
-
分享
微信扫一扫
-
加入群聊
扫码加入群聊