作者:胥森哲
投稿:基础科学与人工智能论坛

2025年7月20日,2025基础科学与人工智能论坛中关村展示中心会议中心举行。

资讯配图

清华大学人工智能研究院常务副院长孙茂松教授主持,北京中关村学院院长、中关村人工智能研究院理事长刘铁岩博士、清华大学电子工程系主任汪玉教授、美国纽约州立大学石溪分校顾险峰教授、曦智科技创始人兼CEO沈亦晨博士四位顶尖AI专家齐聚一堂,围绕人工智能的根本问题展开了一场火花四溅的讨论。

从因果性到原创能力,从算力瓶颈到未来架构,这场论坛为我们勾勒出AI技术的前沿图景与未来挑战。

共有500名来自清华大学求真书院、北京各高校、中学和科研机构的观众到场。

此外,本次论坛还是2025国际基础科学大会的特别活动之一,由清华大学求真书院主办,中信证券股份有限公司与中关村科学城管理委员会协办。

现已连续举办3届,旨在推动交叉学科合作交流,为青年学生搭建了了解科研前沿、激发探索兴趣的平台。

我们将论坛交流内容整理如下:

相关性≠因果性:AI系统的科学化门槛仍在

面对人工智能技术发展的瓶颈与限制顾险峰教授指出,目前AI技术在方法上仍以“相关性”建模为主,缺乏对“因果律”的深刻掌握。

他认为,缺乏因果建模的能力是当前AI在自然科学、数理建模等任务上受到限制的原因。

同时他也强调,真正的科学建模需要简约假设、逻辑自洽的因果体系,不能仅靠大量数据推导模式。

刘铁岩教授则补充称,虽然大模型底层是统计学习的结构,但在高层语义表达中已出现“因果性功能的涌现”,例如在处理逻辑推理、数学解题、文本论证等任务时,大模型展现出了“因为……所以……”的结构理解能力。

他呼吁对因果性的层次与表达保持开放态度,建议从“语义因果性”角度重新评估当前模型的能力边界。

资讯配图

Token范式的尽头:AI模型是否需要世界模型?

与会专家还就“Next Token Prediction是否是通往通用智能的正道”展开讨论。

孙茂松教授率先提出疑问:文本是天然一维的,图像是二维的,视频再加一维时间,世界则是四维的。当认知对象越来越复杂,是否需要彻底摒弃token预测,转向“世界模型”等新范式?

对此,汪玉教授持乐观态度。

他认为,“语言本身是人类认知的表达系统”,图像、视频、物理结构等都可以在二维语言序列中进行展开。

基于此,他提出一个“可描述性”的新边界概念:如果人类能够通过语言准确描述某一对象或规律,AI就有可能通过token prediction模型学会它;如果人类尚未找到语言描述方式,则AI也难以捕捉。

刘铁岩教授对此也补充道,“next token prediction 实际上是语言理解和创作领域的极佳范式”,其泛化能力远超以往所有任务特定模型。

但当AI任务转向如偏微分方程求解、量子系统建模、工业优化等非语言任务时,“当前范式将无法胜任,需要全新学习目标与系统架构。”

AI能否“原创”?推理与建模能力仍不可替代

其次,学者们还进一步聚焦于AI是否具备“原创能力”

顾险峰教授直言:

在科学研究中,重大理论的提出绝非数据堆积所能催生。

另外他以自己学习拓扑学为例指出:

最关键的一步转化,AI永远抓不住。

他强调,科学进步来自“对未知现象的预判与假设”,而非对已知结构的不断模仿。

沈亦晨博士以围棋为喻指出,尽管围棋规则简单,但由于搜索空间巨大(约10^360),“纯靠套路是不足以解决全部问题的。”

他区分了“90%可类推问题”与“10%原创性突破问题”,认为AI可以在大多数工程化问题中大显身手,但在人类科学的“皇冠上的明珠”领域,目前仍力有未逮。

刘铁岩教授则从产业视角提出:

即便AI无法做到“无中生有”,但它在已知边界上的全覆盖与组合重构,仍将对科学研究产生深远影响。

他认为未来AI将在“从类比中发现新结构”方面具有巨大潜力,尤其是在AI for Science的具体子任务中表现出色。

高能效计算是AI基础设施的下一场革命

面对当前大模型对算力的依赖已呈指数增长的问题,孙茂松教授引用数据显示,最新一代大模型训练耗资约达100亿美元,需20万张GPU卡支持,预计2035年将可能突破至1亿张卡。

沈亦晨回应称:

未来未必真的需要1亿张卡,但百万卡级别的计算已成为现实挑战。

他介绍了曦智科技在光互联和光计算芯片方面的进展:

通过光作为连接介质,可以极大提升芯片间通信带宽与效率,解决分布式模型训练中“多芯片如一芯片”的问题。

他进一步强调,要充分发挥光计算的高能效优势,需在算法层面推动向低精度(int4/int8)模型优化。

汪玉补充指出,“未来的关键是让底层硬件异构对开发者透明。”即芯片无论是电计算还是光计算,对开发者应“看起来就是一台机器”,从而保障工程系统的稳定性与迁移效率。

刘铁岩则抛出一种范式设想:

真正的人工智能下半场,将是“Experience-driven AI”。

他设想一个分布式交互学习系统,由100万个机器人在物理世界中实时感知、同步数据和模型权重,实现全域智能协同。

这将超越大模型集中训练范式,形成全新的进化路径。
圆桌论坛精彩纷呈、交锋密集,无论是从“相关性与因果性”的基本认知出发,还是围绕“token预测范式”的边界问题,亦或是对“原创能力”与“算力极限”的前景评估,专家们均展现出深厚的理论思考与实践视角。

正如孙茂松教授在总结中所说:

大模型的有效性是经验主义的,但它的问题也是根本性的。真正的突破,有赖于我们在理论与系统两端都迈出新的一步。

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!

—  —

资讯配图


🌟 点亮星标 🌟

科技前沿进展每日见