资讯配图
资讯配图
资讯配图


7月14日,李彦宏在百度高管会上发言称,Robotaxi(自动驾驶出租车)要切换到纯视觉路线才有机会,并宣布百度旗下自动驾驶出行服务平台萝卜快跑将彻底放弃多传感器融合路线,全面转向纯视觉技术方案。在实现完全自动驾驶(FSD,Full Self-Driving)的技术路径中,以特斯拉为代表的“纯视觉+神经网络”方案与Waymo(谷歌旗下无人驾驶出租车)等公司倡导的“多传感器融合”方案之间的技术路线之争日益激烈。纯视觉方案追求极简主义与成本效益最大化,通过算法创新与数据闭环降低硬件门槛;而多传感器融合方案则强调冗余设计与安全性优先,凭借全天候感知能力与高可靠性,二者不仅关乎硬件配置与算法选择,更是两种截然不同的技术哲学的碰撞,完全自动驾驶技术路径之争已进入新阶段。

资讯配图


一、自动驾驶分级标准

根据国际通用的SAE分级标准,自动驾驶技术被划分为从L0至L5六大层级。

表1 自动驾驶技术分级 

资讯配图

我国在2022年3月1日实施的《汽车驾驶自动化分级》标准对SAE分级进行了本土化细化。L2级被定义为“组合驾驶辅助系统需同时具备对车辆横向及纵向运动控制相适应的部分目标和事件探测与响应的能力”,与L1级单一方向控制形成明确区分;L4级则特别强调“当自动驾驶系统无法继续执行动态驾驶任务时,系统需自行采取措施将车辆事故风险降低至可接受程度”。这一分级体系为理解不同技术路线的应用场景提供了重要参考。

从技术演进角度看,当前全球智能驾驶正处于由L2向L3转变的关键时期。数据显示,我国在售新车L1渗透率约为11%,L2渗透率达51%,L3和L4渗透率分别为20%和11%,预计2025年各级别自动驾驶渗透率合计将达到80%。表明自动驾驶技术正加速从辅助驾驶向有条件自动驾驶过渡,而这一过渡期正是两种技术路线竞争最为激烈的阶段。


二、两大技术路径解析


1


纯视觉+神经网络:算法驱动的成本革命

纯视觉+神经网络方案完全依赖先进的计算机视觉技术,其核心理念是利用高清摄像头采集现实世界图像,借助深度神经网络进行环境感知与场景理解。其技术原理主要体现在三个方面。一是多摄像头布局与数据拼接。特斯拉采用环绕车身的8颗摄像头,包括前视、侧视和后视摄像头,通过图像拼接技术形成360°全景视野,对周围环境的监测距离最远可达250米。这种布局模仿了人类驾驶员的视觉感知方式,能够捕捉车辆周围不同角度的信息。二是HydraNets多任务神经网络。特斯拉的HydraNets技术能够同时处理多种驾驶任务,如车道线识别、障碍物检测、交通标志理解等。通过深度学习模型,系统能够自动提取图像中的关键信息,并进行端到端的决策与控制。三是BEV+Occupancy Network技术。特斯拉的FSD V12版本采用BEV(鸟瞰图)网络架构,将3D环境信息转化为2D鸟瞰图进行处理,结合Occupancy Network(占用网络)技术,实现对道路空间的精确建模与理解。

纯视觉方案的最大优势在于成本效益显著。由于仅使用摄像头,整车制造与维护成本可大幅降低。据估算,特斯拉纯视觉方案可使硬件成本相比多传感器方案减少约30%。此外,系统结构简洁,硬件组件少,潜在故障点少,后期维护成本也随之降低。

随着AI技术的不断迭代,视觉系统的算法能力持续提升。特斯拉FSD V12版本通过端到端神经网络架构,将代码量缩减90%,显著提升了系统的整体性能。这种算法驱动的创新使纯视觉方案在复杂环境理解和动态决策方面不断突破,甚至在某些场景下超过了多传感器融合方案的性能。

然而,纯视觉对气候敏感性强是其首要挑战摄像头在雨、雾、雪等低能见度天气中识别能力显著下降。美国国家公路交通安全管理局(NHTSA)数据显示,约21%的相关车祸发生于雨雾等视线受限场景,这对纯视觉方案构成了严峻考验。此外,高度依赖训练数据也是一大短板。纯视觉方案的表现效果严重依赖于训练数据的覆盖范围与质量,一旦遇到数据未涵盖的极端驾驶情形,可能产生识别偏差与误判风险。


2


多传感器融合方案:冗余设计的安全保障

多传感器融合方案主张综合运用激光雷达(LiDAR)、毫米波雷达、摄像头等多类传感器,共同构建车辆对外部环境的感知体系。Waymo、百度Apollo等企业采用此方法,通过不同传感器数据互补,提高系统的精度。一是传感器数据同步与校准。多传感器融合面临的主要挑战是如何将不同传感器(如激光雷达、摄像头、毫米波雷达)在不同时间、不同空间坐标系下的数据进行有效融合。例如,激光雷达的点云数据与摄像头的图像数据需要通过空间转换矩阵(R、T矩阵)进行坐标系对齐,而时间同步则需要通过分段样条插值等算法实现。二是多源数据融合算法。多传感器融合需要采用先进的算法(如全局最近邻算法、D-S证据理论等)对不同传感器的数据进行加权融合,形成对环境的统一理解。例如,前方的车辆目标识别,毫米波雷达能识别障碍物距离和速度,前视摄像头能识别障碍物类型,激光雷达能提供高精度的3D位置信息,三者融合后可达到接近100%的识别准确率。三是冗余设计与故障容错。多传感器融合方案通过部署多种类型传感器,形成冗余感知能力。当某一种传感器因环境因素失效时,其他传感器仍能提供关键信息,确保系统安全运行。例如,激光雷达在黑暗、雨天等条件下高效运行,与摄像头互补,使车辆具备更强的全场景适应性。

表2 自动驾驶传感器方案特点

资讯配图

多传感器融合方案的成本与性能存在显著差异。以Waymo的L4级自动驾驶系统为例,其采用高线束激光雷达(300米探测范围)、多摄像头及毫米波雷达,硬件成本超过7万美元。相比之下,华为ADS 3.0通过优化传感器配置(如激光雷达数量从3个减至1个,摄像头从多目转向双目),同时提升算法效率,将算力需求从400TOPS降低至200TOPS,显著降低了硬件成本。

在实际应用中,多传感器融合方案已在多个场景实现商业化落地。例如,华为ADS 3.0在复杂城市环境中能够应对各种突发情况,如“鬼探头”等危险场景;百度Apollo在港口、矿区等场景的自动驾驶系统通过多传感器融合实现了高精度定位与环境感知,提升了作业效率。此外,文远知行的L4级Robotaxi在广州试运营一年提供15万趟行程,期间没有发生一起主动责任事故,证明了多传感器融合方案在特定场景下的可靠性。


安全性与成本效益:两种技术路线的核心博弈

自动驾驶技术路线选择的核心博弈点在于安全性与成本效益的权衡。纯视觉方案与多传感器融合方案在这两个维度上表现各异,形成了鲜明对比。


1


安全性方面,多传感器融合方案展现出明显优势

根据实测数据,多传感器融合系统在复杂道路与极端天气中的可靠性显著高于纯视觉方案。例如,在暴雨天气下,某新势力品牌的纯视觉城市NOA系统接管率飙升至1.8次/百公里,误判率高达32%,而多传感器融合方案在城区场景的识别率可达98%以上。此外,多传感器融合方案通过冗余设计,能够降低感知故障概率,提高系统在紧急情况下的响应能力。

纯视觉方案在算法创新与数据闭环的支撑下,也在不断提升安全性。特斯拉FSD系统通过40亿公里路测数据训练,结合云端大模型持续迭代,使系统能像人类一样通过“试错”优化驾驶策略。其FSD V12版本在旧金山复杂路况下实现了99.99%的接管间隔里程,证明了纯视觉方案在特定场景下的可靠性。此外,纯视觉方案通过减少传感器数量,降低了系统复杂度与潜在故障点,提高了系统稳定性。


2


成本效益方面,纯视觉方案优势明显

相较于激光雷达,摄像头技术成熟且价格低廉。数据显示,激光雷达成本已从2018年的数万美元降至2025年的200-500美元,但仍高于摄像头。纯视觉方案通过减少硬件成本,使自动驾驶技术能够更快地普及到大众市场。例如,特斯拉通过纯视觉方案将自动驾驶硬件成本降低了约30%,使FSD系统能够以相对较低的价格提供给消费者。


3


从行业发展趋势看,两种技术路线正在走向差异化应用

纯视觉方案主要应用于L2/L3级乘用车,通过数据闭环优化提升性能;多传感器融合方案则在L4级Robotaxi、港口物流、矿区运输等场景商业化进展较快。例如,百度在武汉投放的千余辆“萝卜快跑”自动驾驶网约车采用多传感器融合方案,实现了大规模商业化运营;而特斯拉则通过纯视觉方案推动L2级自动驾驶的普及,截至2025年4月,其FSD系统已覆盖99.99%的已知极端案例。


四、监管环境与社会接受度:影响技术路线选择的关键因素

自动驾驶技术路线的选择不仅受技术本身影响,还受到监管环境与社会接受度的深刻制约。这两种外部因素正在成为影响技术路线选择的关键变量。

在监管环境方面,各国政府正加紧制定自动驾驶法规,不同地区对自动驾驶系统的技术要求及安全验证标准,将深刻影响行业的技术选择倾向。我国在2023年11月发布的《关于开展智能网联汽车准入和上路通行试点工作的通知》中,首次针对搭载L3级和L4级自动驾驶系统的智能网联汽车开展准入试点。该通知要求L3级自动驾驶系统需满足功能安全与故障降级要求,间接推动了多传感器冗余设计。相比之下,美国各州在自动驾驶技术的法规制定上更具多样性。加利福尼亚、亚利桑那和内华达等州已经制定了较为完善的自动驾驶车辆测试和应用法规,允许在特定条件下进行自动驾驶汽车路测和商业运营。这些州的法规通常要求自动驾驶车辆在测试和运行期间需要有安全驾驶员随车,以便在必要时接管控制,这为纯视觉方案提供了相对宽松的测试环境。

在社会接受度方面,消费者对自动驾驶技术的信任程度直接关系到其市场渗透率。数据显示,仍有近70%的消费者对自动驾驶汽车持保留态度,主要因安全性尚未充分验证。然而,不同技术路线在消费者心中的形象存在明显差异。多传感器融合方案因“冗余性强、稳定性高”的特点,更容易获得消费者信任;而纯视觉方案则因“成本优势突出、系统结构简洁”的特点,更容易被大众市场接受。


结语

迈向全自动驾驶的进程,不仅是技术的角力,更是人类与机器关系演进的缩影。“纯视觉+神经网络”与“多传感器融合”之间的分歧,远不止于硬件配置,更代表了不同的认知逻辑与工程路径。未来,随着AI算法、传感器性能与算力平台的不断进步,融合两者优势的感知系统将可能成为主流,真正推动自动驾驶技术走入千家万户,重塑人类出行方式的未来。


作者简介

于镭

咨询工程师(投资),长期服务政府部门,深耕区域政策研究、项目咨询、项目谋划、资金申请等领域。



      E N D    

编辑 | 么大为

审核 | 李   

资讯配图