点击上面↑“电车界”关注记得加☆“星标”!

电车界7月17日消息

解决现实世界中的人工智能问题—— 无论是自动驾驶、实体机器人还是高级推理领域 —— 都需要超乎想象的计算能力。为应对这一挑战,特斯拉在自主研发定制化 AI 训练硬件的同时,也在公开市场采购相关设备。

据报道,特斯拉新一代 Dojo 2 芯片已与全球最大半导体制造商台积电合作进入量产阶段。尽管许多人可能认为这只是次要项目,但扩大计算基础对特斯拉实现百亿亿次超级计算至关重要,而这正是其所有 AI 雄心的核心支撑。埃隆・马斯克称 Dojo 2 是 “一台出色的计算机”,还抛出经典的性能玩笑 ——Dojo 2 确实能以每秒 10 亿帧的速度运行《孤岛危机》。

百万兆次级 AIFSDOptimus 及更多应用

尽管特斯拉目前仍在高效利用第三方 GPU 训练模型,但 Dojo 超级计算机是从底层构建的专用解决方案,专为处理海量视频数据以训练神经网络而设计,而 Dojo 2 芯片正是释放这一潜力的关键。

Dojo 2 将训练全自动驾驶(FSD)依赖的视觉神经网络,让特斯拉能更快处理全球车队产生的视频数据。随着 FSD 持续迭代,最大挑战之一在于处理边缘案例的视频数据 —— 可能要分析数十万英里的训练数据才能识别并训练一个边缘案例,而所有数据都需要经过分析、标记和处理,这正是 Dojo 2 的核心任务。每一段有用的新训练数据,都能帮助特斯拉向 “99.999... 的精度目标迈进,让 FSD 不断优化升级。

这一过程需要海量计算资源和训练时间,却是改进 FSD 的必经之路。当然,其应用不止于车辆 FSD:特斯拉人形机器人 Optimus 同样依赖 FSD 实现物理世界的导航与交互。尽管 Optimus 搭载的是定制版 FSD,但其核心仍是 FSD—— 也就是说,为汽车分析环境、构建 3D 世界地图的神经网络,同样在为 Optimus 完成相同的工作。

AI 硬件的定制化路径

Dojo 2 的强大不仅源于原始计算能力,更来自一系列架构设计 —— 这些设计使其在 FSD 训练中表现卓越,并区别于通用硬件甚至其他 AI 专用硬件。

为此,特斯拉采用了台积电全新的硅晶圆集成扇出(InFO-SoW)封装技术。对于大规模 AI 工作负载,散热和芯片间数据传输速度往往是最大瓶颈。这种新封装技术支持处理芯片间的高带宽直接连接,既能降低延迟,又能显著提升散热效率,这些都是构建大规模高密度计算集群的关键。

与通用芯片不同,Dojo 2 搭载定制指令集,专为训练 FSD 设计。其核心经过特殊优化,可加速特定数学运算(如矩阵乘法和 systolic 数组运算)—— 这些正是特斯拉视觉神经网络的核心运算基础。

通过自主研发硬件,特斯拉能将软件和编译器与芯片深度集成,针对特定工作负载优化性能,避免因使用第三方软件(如英伟达 CUDA)而产生的性能损耗。

对部分人而言,Dojo 2 的启动或许看似次要,但实则是特斯拉 AI 技术发展的关键一步 —— 这让其相比使用现成硬件的竞争对手具备优势。要让 FSD 以合理速度迭代(而非近几个月的缓慢进度),特斯拉必须持续投入定制化硬件研发。(译自notateslaapp

你也可以关注其他账号内容。

扫码加入电车界车友群!!!