点击下方卡片,关注「3D视觉工坊」公众号
选择星标,干货第一时间送达

3D视觉工坊很荣幸邀请到了UCF三年级博士生Qucheng Peng,为大家着重分享他们团队的工作:NavigScene。如果您有相关工作需要分享,欢迎文末联系我们。

资讯配图NavigScene: Bridging Local Perception and Global Navigation for Beyond-Visual-Range Autonomous Driving
论文https://arxiv.org/pdf/2507.05227

直播信息

时间

2025年07月28日(周一)10:30

主题

ACM MM'25 | 小鹏最新:利用导航指令模仿人类驾驶员的超视距自动驾驶

直播平台

3D视觉工坊哔哩哔哩

扫码观看直播,或前往B站搜索3D视觉工坊观看直播

资讯配图

3D视觉工坊视频号也将同步直播

主讲嘉宾

Qucheng Peng

现为UCF三年级博士生,同时在Amazon担任研究实习生。研究方向为基于高斯溅射的多模态3D场景理解,以及多模态大模型在自动驾驶等领域的应用。曾在ICLR,CVPR,ICCV,IJCAI,ACM MM等会议上发表独立一作论文,并担任BMVC领域主席,以及NIPS,ICCV,TIP,TNNLS等会议期刊审稿人。

直播大纲

  1. 自动驾驶研究问题简介
  2. 导航数据集的视觉生成和文本生成
  3. 基于导航数据集的多模态大模型后训练
  4. 基于导航数据集的视觉-语言-动作模型

参与方式

资讯配图

:3D视觉工坊很荣幸邀请到了UCF三年级博士生Qucheng Peng,为大家着重分享他们团队的工作:NavigScene。如果您有相关工作需要分享,欢迎联系微信:cv3d009,请备注:姓名/昵称+工作名称,则不予通过。